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VERSAO PRELIMINAR 


Dedicado as minhas filhas 


Cintia, Luiza e Beatriz 


Physical laws should have mathematical beauty. 


Paul Adrien Maurice Dirac 


Poets say science takes away from the beauty of the stars — 
mere globs of gas atoms. I too can see the stars on a desert night, 
and feel them. But do I see less or more? The vastness of the 
heavens stretches my imagination. A vast pattern — of which I am 
a part. It does not do harm to the mystery to know a little about 
it. Far more marvellous is the truth than any artists of the past 
imagined it. What men are poets who can speak of Jupiter if he 
were a man, but if he is an immense spinning sphere of methane 
and ammonia must be silent? 


Richard Phillips Feynman 
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PREFACIO 


Lend me your ears and Ill sing you a song, 


And Tl try not to sing out of key. 


With a Little Help From My Friends 
John Lennon & Paul McCartney 


A mecânica analítica é o alicerce da física teórica. O grandioso edifício da teoria 
quântica foi erigido sobre a base da mecânica analítica, particularmente na forma devida 
a Hamilton. A mecânica estatística e as teorias de campos das partículas elementares 
são fortemente marcadas por elementos estruturais extraídos da mecânica clássica. Além 
disso, o vertiginoso desenvolvimento das teorias do caos e dos sistemas dinâmicos em geral 
promoveu um renascimento da mecânica clássica nas últimas décadas do século XX. Assim, 
o estudo de praticamente qualquer ramo da física atual requer uma formação sólida em 
mecânica analítica, a qual, por si só, continua sendo de enorme importância por suas 


aplicações em engenharia e na mecânica celeste . 


Ao longo de duas décadas, de forma intermitente, o autor vem ministrando a dis- 
ciplina de mecânica analítica no curso de graduação em Física da Universidade Federal 
Fluminense. O presente texto, fruto dessa experiência e de uma atração ininterrupta pelo 
assunto, destina-se a estudantes de graduação que tenham passado por um curso inter- 
mediário de mecânica num nível comparável ao de Symon (1971) ou Marion & Thornton 
(1995). Quanto aos pré-requisitos matemáticos, os cursos usuais de cálculo de uma e várias 


variáveis, equações diferenciais ordinárias e álgebra linear são suficientes. 


A mecânica analítica é uma disciplina de caráter eminentemente matemático. As- 
sim, sem descurar dos aspectos físicos, procuramos manter um padrão razoável de rigor 
matemático na exposição. A maior concessão nesse campo é o emprego de quantidades in- 
finitesimais, que consideramos pedagogicamente aconselhável numa primeira apresentação 
ao estudante das noções de deslocamento virtual e de famílias contínuas de transformações. 
Evitamos sobrecarregar o texto com resultados matemáticos auxiliares, exceto quando 
pareceu possível integrá-los com certa naturalidade ao desenvolvimento do formalismo. 
Alguns teoremas, de uso mais geral e frequente, estão provados nos apêndices; nos demais 
casos, referimo-nos a textos matemáticos onde eles estão demonstrados de forma precisa. 
Entendemos que a progressiva substituição de argumentos heurísticos por procedimentos 
matematicamente rigorosos está em sintonia com as tendências da física teórica atual, cuja 


linguagem matemática vem se tornando crescentemente sofisticada e rigorosa. 
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O aparato matemático da mecânica analítica é muito rico e permite o primeiro contato 
do estudante com técnicas e conceitos largamente empregados nos mais variados ramos da 
Física, porém no contexto de uma teoria clássica, no qual a intuição é um guia relativa- 
mente seguro. Noções como as de operador linear, autovalor, autovetor, grupo e álgebra 
de Lie surgem naturalmente, aplicadas a situações mais fáceis de visualizar. O alto grau de 
generalidade do formalismo da mecânica analítica serve para desenvolver no estudante a 
capacidade de abstração, tão necessária para tornar possível compreender as teorias físicas 
contemporâneas. Como observa V. I. Arnold, numerosas teorias matemáticas modernas, 
com as quais estão associados alguns dos maiores nomes da história da Matemática, devem 
sua existência a problemas de mecânica. Apesar de conscientes dos grandes desenvolvi- 
mentos matemáticos recentes, nos quais métodos geométricos e topológicos desempenham 
um papel crucial, adotamos a abordagem tradicional por julgá-la mais adequada a um 
primeiro curso de mecânica analítica. Uma vez adquirida a formação básica, o leitor es- 
tará apto a enveredar pelos caminhos mais difíceis da dinâmica qualitativa (Arnold 1976; 
Thirring 1997). Os livros recentes de Scheck (1994) e de José & Saletan (1998) possibilitam 
uma transição mais suave do tratamento convencional à formulação altamente matemati- 
zada da teoria dos sistemas dinâmicos em linguagem geométrica, essencial para a análise 


de problemas de estabilidade e sistemas caóticos. 


A mecânica analítica é muito mais do que uma mera reformulação da mecânica new- 
toniana, e os seus métodos não foram concebidos primordialmente para facilitar a resolu- 
ção de problemas mecânicos específicos. Tentamos deixar isso claro pondo em relevo as 
propriedades de simetria e invariância e os aspectos estruturais da mecânica. Os livros 
de Goldstein (1980) e Landau & Lifchitz (1966), nos quais o autor aprendeu mecânica 


analítica, exerceram grande influência na elaboração do texto. 


Nossa exposição caracteriza-se por um grande número de exemplos resolvidos, obje- 
tivando torná-la acessível aos estudantes típicos. Ao mesmo tempo, pretendemos que o 
texto seja estimulante e desafiador aos melhores estudantes. A bibliografia relativamente 
extensa, com a menção a livros avançados e a artigos publicados em periódicos, vários 
deles bastante recentes, tem por fito excitar a curiosidade do leitor e deixar claro que a 
mecânica clássica não é peça de museu nem constitui um capítulo encerrado da Física. 
Pelo contrário, o seu poder de encantamento não parece diminuir com a passagem do 
tempo e ainda há muitos problemas dignos de investigação, alguns deles monumentais 
como o problema da estabilidade do sistema solar, o qual permanece sem resposta con- 
clusiva. Com o intuito de fazer contato com aplicações modernas, resolvemos incluir uma 
introdução aos sistemas hamiltonianos com vínculos em virtude de sua grande importância 
na física teórica atual, apesar de ser um tópico com um grau de dificuldade acima da média. 


Neste mesmo espírito, discutimos com alguma profundidade o tratamento do tempo como 


vu 


variável canônica e as teorias com tempo parametrizado, o que se justifica pela amplas 
aplicações na teoria quântica da gravitação em geral, e na cosmologia quântica em parti- 


cular. 


Os exercícios salpicados ao longo dos capítulos são parte inseparável da exposição, e 
todo estudante sério deve procurar resolvê-los ao topar com eles. Os problemas no fim 
de cada capítulo servem, em sua maioria, como ilustrações e extensões da teoria exposta 
no texto principal. Há certos problemas, no entanto, que introduzem idéias ou técnicas 
novas, algumas delas frutos de trabalhos de pesquisa relativamente recentes. Os resultados 
de alguns problemas são empregados em exemplos, problemas ou no corpo do texto de 


capítulos subsequentes. 


Se conseguirmos transmitir ao leitor um pouco do que há de fascinante neste belo 
ramo da Física e, assim, estimulá-lo a prosseguir trilhando caminhos mais elevados, nosso 


objetivo terá sido plenamente atingido. 


Niterói, setembro de 2000 Nivaldo A. Lemos 
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Capitulo 1 


DINAMICA LAGRANGIANA 


Lagrange has perhaps done more than any other analyst ... by showing that the 
most varied consequences respecting the motion of systems of bodies may be derived 
from one radical formula; the beauty of the method so suiting the dignity of the 
results, as to make of his great work a kind of scientific poem. 


William Rowan Hamilton 


Sistemas mecânicos sujeitos a restrições (vínculos) de natureza geométrica ou cinemáti- 
ca ocorrem com frequência. Em tais situações a formulação newtoniana revela-se incon- 
veniente e antieconômica, pois exige o uso de variáveis redundantes e as forças de vínculo 
aparecem de forma explícita. O poderoso e elegante formalismo desenvolvido por Lagrange 
permite escrever as equações de movimento a partir de uma única função escalar expressa 
em termos de coordenadas independentes arbitrárias, com a vantagem adicional de não 


envolver as forças de vínculo. 


1.1 Princípios da Mecânica Newtoniana 


A justa apreciação do significado e abrangência das formulações gerais da mecânica 
clássica requer uma breve revisão dos princípios fundamentais da mecânica newtoniana, 
com a qual supõe-se que o leitor já esteja familiarizado. Praticamente desde a sua for- 
mulação nos Principia, as três leis do movimento de Newton vêm sendo alvo de con- 
trovérsias quanto ao seu conteúdo físico e consistência lógica, o que tem gerado propostas 
de reformulação da versão tradicional com o intuito de escapar às críticas (Eisenbud 1958; 


Weinstock 1961). Embora a primeira e segunda leis sejam às vezes interpretadas como uma 
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definição de força (Marion & Thornton 1995), adotaremos o ponto de vista que julgamos 
mais correto, segundo o qual elas são leis genuínas e não meras definições (Anderson 1990). 
Uma análise detalhada dos aspectos físicos e da estrutura lógica das leis de Newton tran- 
scende o escopo desta seção, cujo propósito primordial é servir de referência para o restante 
da exposição. Os postulados enunciados a seguir equivalem às três leis do movimento de 


Newton, mas procuram evitar certas dificuldades lógicas da proposição original. 


PRIMEIRA LEI. Existem sistemas de referência, ditos inerciais, em relação aos 


quais toda partícula isolada descreve um movimento retilíneo uniforme. 


A existência de um referencial inercial implica a existência de uma infinidade de outros, 
todos movendo-se entre si em linha reta com velocidade constante. Neste postulado está 
implícita a noção newtoniana de tempo absoluto, que “flui uniformemente sem relação 
com qualquer coisa externa” e é o mesmo em todos os referenciais enerciais. Considera-se 


“isolada” uma partícula suficientemente afastada de todos os objetos materiais. 


SEGUNDA LEI. Em qualquer referencial inercial o movimento de uma partícula é 
regido pela equação 
ma =F, (1.1.1) 


onde a é a aceleração da partícula, m sua massa e F a força total a que ela está sujeita. 


Este postulado pressupõe, implicitamente, que a cada partícula está associada uma 


constante positiva m, denominada massa, que é a mesma em todos os referenciais inerciais. 


TERCEIRA LEI. A cada ação corresponde uma reação igual e oposta, isto é, se F;; 
é a força sobre a partícula i exercida pela partícula j, então 


F.: 


q = — Fj. (1.1.2) 


Esta é a lei da ação e reação em sua forma fraca. Em sua versão forte, esta lei 
declara que, além de iguais e opostas, as forças são dirigidas ao longo da linha que une as 
partículas; em outras palavras, duas partículas só podem se atrair ou repelir. A terceira 
lei não tem validade geral, pois as forças entre cargas elétricas em movimento geralmente 
a violam. Isto deve-se à velocidade finita de propagação das interações eletromagnéticas, o 


que exige introduzir a noção de campo eletromagnético como mediador de tais interações. 
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No caso de um sistema contendo várias partículas, supõe-se que a força sobre cada uma 
delas pode ser decomposta em forças externas, produzidas por fontes exteriores ao sistema, 
e forças internas, que devem-se às demais partículas do sistema." Assim, a equação de 


movimento da i-ésima partícula de um sistema de N partículas é, conforme a segunda lei, 


d i x e 
z =) Fy + FP, (1.1.3) 
fz 
onde 
dri 


é o momento linear da i-ésima partícula, m; sua massa, r; seu vetor posição, v; sua 


velocidade e FO denota a força externa sobre ela. 


Somando sobre todas as partículas deduz-se? 


d? r; 


Dm = Fy + FO = Ss FO (1.1.5) 


porque (vide Eq.(A.9) do Apêndice A) 
1 
> Fi S > (Fy +F;)=0 (1.1.6) 


em virtude da Eq.(1.1.2). Definindo o vetor posição do centro de massa por 


= Di miri = Di miri 


R = 
Ximi M ? 


CER 


a Eq. (1.1.5) assume a forma 


ËR 


M—— 
dt? 


= FO =FO, (1.1.8a) 


'Descarta-se a possibilidade de uma partícula agir sobre si mesma. 
: ; N Baas ce 
2De agora em diante abreviaremos 5),., por >,,, estando implícito que a soma estende-se a todas as 
partículas do sistema, salvo indicação em contrário. 
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ou 


dP 
— = Fe 1.1.8b 
fr ( ) 
em termos do momento linear total do sistema definido por 
dri dR 
PS iVi = MS 1.1.9 
Pad er E Gi 


Infere-se, assim, uma importante lei de conservação. 


Teorema da Conservação do Momento Linear. Se a força externa total é zero, 


o momento linear total de um sistema de partículas é conservado. 


O momento angular total do sistema em relação a um ponto Q com vetor posição ro 
Doa a E (r: - ro) x (bio), (1.1.10) 


(Q) (Q) 


onde r;*’ = r;— ro e v;” = ř;— fg são, respectivamente, o vetor posição e o vetor 


velocidade da i-ésima partícula em relação ao ponto Q. Portanto, 


L 
a aa = mv ee -= ro) x pi - ye r; — ro) X Eq 
= \\(r; — rọ) x Fy + X (r; — ro) x FP — M(R — ro) x ËQ , (1.1.11) 
A t 


tendo sido usadas as Eqs.(1.1.3), (1.1.4) e (1.1.7). Mas, explorando a Eq.(A.9), podemos 


escrever 


1 
Dr; — rQ) x Fy = 5 l: = ro) x Fy + (rj — ro) x Fy 
ij iij 
1 1 
= [To — (r; = ro)] x Fy > (r rj) x Fij (1.1.12) 
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com a ajuda da Eq. (1.1.2). Se as forças internas obedecem à forma forte da terceira lei de 
Newton, então F;; tem a mesma direção que o vetor r;; = r; — r; que aponta da j-ésima 
para a i-ésima partícula, de modo que r;; x F;; = 0. Assim sendo, a Eq. (1.1.11) pode ser 


reescrita na forma 


dL : : 
F = NS) — M(R- ro) xi , (1.1.13) 


onde 


NS? = S-(r; — ro) x FY? (1.1.14) 


i 


é o torque externo total em relação ao ponto Q. Se o ponto Q está em repouso ou é o 


centro de massa, o segundo termo à direita da Eq.(1.1.13) é nulo? e ficamos com 


L 
To ZN e (1.1.15) 


Esta última equação implica uma importante lei de conservação, na qual o momento 


angular e o torque são tomados relativamente a um ponto fixo ou ao centro de massa. 


Teorema da Conservação do Momento Angular. O momento angular total de 


um sistema de partículas se conserva se o torque externo total é nulo. 


A Eq.(1.1.9) assevera que o momento linear total de um sistema de partículas coincide 
com o calculado como se toda a sua massa estivesse concentrada no centro de massa. No 
caso do momento angular a situação é um pouco mais complexa. Se R é o vetor posição 
do centro de massa em relação à origem O de um sistema de coordenadas inercial e r; é o 


vetor posição da i-ésima partícula em relação ao centro de massa, então 


ynarn+R , vsv+V, (1.1.16) 


onde V = R é a velocidade do centro de massa em relação a O e v; =r’, é a velocidade da 
i-ésima partícula em relação ao centro de massa. O momento angular total relativamente 


à origem é 


3Outra possibilidade, que não consideraremos, é a de um ponto Q com aceleração sempre ao longo da 
linha que une o próprio ponto Q ao centro de massa (Tiersten 1991). 


12 CAPÍTULO 1. DINÂMICA LAGRANGIANA 


d 
L= So mrixv=> mir, x vi + (95 mir)xV+Rx gO mati) + MR xV , (1.1.17) 


onde usamos (1.1.16). Da primeira das equações (1.1.16) decorre que 


So mir, = Y mri} mR=MR-MR=0. (1.1.18) 


Assim, o momento angular total em relação à origem admite a decomposição 


L=RxMV+% rixpi. (1.1.19) 


Em palavras: o momento angular total em relação à origem é o momento angular do 
sistema como se estivesse concentrado no centro de massa acrescido do momento angular 


associado ao movimento em torno do centro de massa. 


Por fim, consideremos a energia. A energia cinética total é definida por 


1 
Ct, Sim. (1.1.20) 
Com o uso de (1.1.16) resulta 
1 12 1 2 d 1 
Ta 5 Dar + z 2 mV +V. g È miri) ; (1.1.21) 
donde, devido a (1.1.18), 
M 1 
T= di Ro Som”. (1.1.22) 


A energia cinética total é a soma da energia cinética do sistema como se estivesse con- 
centrado no centro de massa com a energia cinética do movimento em torno do centro de 


massa. Este resultado é particularmente útil na dinâmica do corpo rígido. 


O trabalho realizado por todas as forças para levar o sistema de uma configuração 


inicial 4 a uma configuração final B é definido por 


B B B 
Wap = D E” +) Fy) dr; = D FPD S F,;-dr;. (11.323) 
i : ‘ iy 


jži 
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Usando a equação de movimento (1.1.3) deduz-se 


B B 1 
Was = E my; vidt = DI d(smiv) f (1.1.24) 


donde 
W= the: (1.1.25) 


isto é, o trabalho realizado é igual à variação da energia cinética. 


Em numerosos casos as forças são conservativas, ou seja, derivam de potenciais es- 
calares. Suponhamos que as forças externas admitam uma função energia potencial 
V®©(ri,..., ry) tal que 

FO = -VV ® , (1.1.26) 


onde V; = id/ Ox; + ja/ Oy; + kd/ Oz; é o operador nabla em relação à variável r;. Neste 


caso, 


B B B 
5] FO. dr; = -f S VVO . dr; = -f VO-vVO-vO. (1927 


Se F;; depende apenas das posições relativas r;; = r; — r; e, além disso, é dedutível de 


uma função energia potencial V;;(r;;) com Vi; = Vj, então podemos escrever 


Esta forma assegura a validade da versão fraca da lei da ação e reação. Com efeito, 


Se, além disso, V;; depender somente da distância s;; = |r;;| entre as partículas (forças 
centrais) temos 
Fj=—ViVij(sij) =- Vis) (1.1.30) 
Sij 


onde Vi; é a derivada de V;; em relação a seu argumento, de modo que F;; aponta ao longo 


da linha que une as partículas e a lei da ação e reação vale em sua forma forte. 
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A Eq.(1.1.29) nos permite escrever 


B 1 B 1 B 
2 Fa d= 5 J, (Fy: dri+ Fa: dr) = 55> f, F; - d(r; — r;) 
ii iZj 

S d ES ead Oy Í (1.131) 
=- Vig: drj = -3 / VS ijl > 1.1.31 
2 ij YA E J 2 A Jia J 2 a Aly 


ij ij 123 


onde V;; denota o gradiente em relação ao vetor r;;, tendo sido utilizada a propriedade 
evidente ViVi; = Vi;jVi;. Finalmente, combinando as Eqs.(1.1.23), (1.1.25), (1.1.27) e 
(1.1.31) deduz-se 


LL See Shae as (1.1.32) 
com 1 
V=VvV® +4 32a Vis ; (1.1.33) 


O segundo termo no lado direito da Eq.(1.1.33) é chamado de energia potencial interna 


do sistema. Destes últimos resultados decorre uma importante lei de conservacao.* 


Teorema da Conservação da Energia. Se todas as forças são conservativas, a 


energia total E = T + V de um sistema de partículas é conservada. 


1.2 Vínculos 


Restrições de natureza geométrica ou cinemática que limitam a priori o movimento de 
um determinado sistema mecânico são chamadas de vínculos. É importante sublinhar que 
vínculos são limitações de ordem cinemática às posições e/ou velocidades das partículas 
de um sistema mecânico que antecedem a dinâmica, e devem ser levadas em conta na 
formulação das equações de movimento do sistema. Alguns exemplos bastante simples 


serão considerados a seguir. 


E Exemplo 1.2.1 (Partícula restrita a uma superfície fixa). Seja r = (x, y, z) o vetor posição 
da partícula relativamente a um sistema cartesiano de eixos em relação ao qual a superfície 
permanece fixa. Então x,y,z não são variáveis independentes mas devem satisfazer 


4E evidente que os teoremas de conservação desta seção valem somente em referenciais inerciais, embora, 
isto não conste explicitamente nos referidos enunciados. 
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f@) = f(z,y,z)=0, (1.2.1) 


onde f(r) = 0 é a equação da superfície. Se, por exemplo, a superfície for uma esfera centrada 
na origem, 


f@y2z=2+y+2-R, (1.2.2) 


onde R é o raio da esfera. [| 


E Exemplo 1.2.2 (Partícula restrita a uma superfície móvel ou deformável). Neste caso 
x,y,z obedecem à equação 


f(r,t) = f(z, y,z,t) =0, (1.2.3) 


a dependência temporal explícita indicando a mudança da forma ou localização da superfície no 


transcurso do tempo. E 


E Exemplo 1.2.3 (Duas partículas unidas por uma haste rígida). O vínculo tem a forma 


(ro-rm)-2=0 (1.2.4) 

ou, equivalentemente, 
(z2 — 21)? + (yo - y)? + (2-23) -P =0, (1.2.5) 
sendo l o comprimento invariável da haste. E 


E Exemplo 1.2.4 (Pêndulo duplo plano). As equações de vínculo são 


+n-4=0,(»>-mP+(gp>-n)-B=0, (1.2.6) 


como se depreende da Fig. 1.2.1. E 
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Figura 1.2.1: Pêndulo duplo plano 


Todos os vínculos discutidos acima são ditos holônomos. Se £, .. . , Em são coordenadas 
arbitrárias usadas para descrever a configuração de um sistema mecânico, um vínculo é 


chamado de holônomo” quando pode ser expresso por uma equação da forma 


Fé... ém, t) =0. (1.2.7) 


Vinculos que não podem ser assim representados são ditos não-holônomos. Por exemplo, 
a imposição de que as moléculas de um gás permaneçam no interior de um recipiente 
é descrita por desigualdades: se o recipiente é uma caixa de arestas a,b,c temos O < 
zi<a0O<yw<b0O<z<c onder; = (£i, Yi zi) é o vetor posição da i-ésima 
molécula (tratada como partícula puntiforme). Ocorrem com frequência, especialmente 
na dinâmica do corpo rígido, vínculos representáveis por equações envolvendo velocidades, 


isto é, equações diferenciais da forma? 


glé... Em, És Em, t)=0. (1.2.8) 


E Exemplo 1.2.5 (Cilindro rolando sem deslizar ao longo de uma linha reta). Sendo x a 
posição do centro de massa do cilindro e q o ângulo de rotação em torno do centro de massa, a 
condição de rolar sem deslizar representa-se por 


Do grego hólos (inteiro, completo) e nómos (regra, lei). 
6O ponto sobre uma variável denota derivada em relação ao tempo. 
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Figura 1.2.2: Disco rolando sem deslizar num plano horizontal 


i= Ro, (1.2.9) 


onde R é o raio do cilindro. [| 


E Exemplo 1.2.6 (Disco vertical rolando sem deslizar num plano horizontal). Sejam (x,y) 
a posição do centro do disco, O o ângulo do seu eixo de simetria com o eixo x, e ¢ o ângulo de 
rotação do disco em torno do referido eixo de simetria (ver Figura 1.2.2). Sendo v a velocidade 
do centro de massa, o disco rola sem deslizar desde que v = R$. Notando que à = vz = vsen 0 


e ý = vy = —v cos 0, somos conduzidos às equações 
&—Rdsend=0 , y+Rócos0=0, (1.2.10) 
que exprimem matematicamente a condição de rolamento sem deslizamento. E 


As equações (1.2.9) e (1.2.10) são exatamente da forma (1.2.8). Em geral vínculos deste 
tipo não podem ser reduzidos por uma integração à forma (1.2.7) e, consequentemente, não 
são holônomos. Se um vínculo originalmente expresso na forma (1.2.8) puder ser reduzido 
por uma integração à forma (1.2.7), ele será dito holônomo. Por exemplo, o vínculo (1.2.9) 
é holônomo porque equivale a z — R$ = 0, que tem a forma (1.2.7).” No entanto, vínculos 
diferenciais do tipo (1.2.8) raramente são integráveis. Isto é o que acontece no caso do 
Exemplo 1.2.6. 


7A constante de integração pode ser feita igual a zero por uma escolha adequada da posição ou do 
ângulo no instante inicial. 
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E Exercício 1.2.1. Mostre que os vínculos (1.2.10) não são integraveis. 


Solução. A primeira das Eqs.(1.2.10) é integrável se existe um fator integrante não-nulo 
h(x, y,0,ġ,t) tal que 


hi — hRósen6 = “Ole, y, 0, Q, t) (1.2.11) 


d 


para alguma função G, pois neste caso, em virtude de (1.2.10), a Eq.(1.2.11) será equivalente a 
(C é uma constante arbitrária) 


G(x,y, 0, ¢, t) -C =0 ; (1.2.12) 


que tem a forma (1.2.7). Mas, admitindo que o lado esquerdo de (1.2.11) seja uma derivada total, 
é necessário levar em conta que a ordem de diferenciação é irrelevante nas derivadas segundas 
cruzadas da função supostamente existente G. De acordo com a hipótese (1.2.11) teríamos 
9G/dx = h e OG/0¢ = —hRsen 6, as demais derivadas parciais sendo nulas. Logo, 


2G P&G ðh 
yðr = ðrðy Oy 0 h h(a, 0, Q, t) b) 
G PG ðh 
ðbðx  0x00 Tn e 
3G = OG —s O cnh = hRcos6-0 = h=0 
0006 9900 00 e E is 


A inexistência de fator integrante não-nulo prova que a primeira das Egs.(1.2.10) não constitui 


um vínculo holônomo, argumento análogo aplicando-se à segunda das Eqs.(1.2.10). E 


Vinculos expressos por equações diferenciais não-integráveis representam restrições 
sobre as velocidades. O centro de massa do disco do Exemplo 1.2.6 pode percorrer uma 
circunferência de tal modo que x, y e 0 retornem aos seus valores originais. Mas, ao final 
do processo, ¢ pode atingir um valor arbitrário, dependendo do comprimento da circun- 
ferência descrita. Isto indica que não existe qualquer relação de dependência funcional 


entre as variáveis que descrevem a configuração do disco em cada instante. 


1.3 Deslocamentos Virtuais 


Para um sistema mecânico sujeito a vínculos, num dado instante t há uma infinidade 


de configurações possíveis, isto é, consistentes com os vínculos. Os deslocamentos infinite- 
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simais de cada partícula que levam de uma configuração possível a outra infinitesimalmente 
próxima são chamados de deslocamentos virtuais. Mais precisamente, dado um sistema 
de N partículas os deslocamentos virtuais 6r;,1 = 1,...,N, são deslocamentos infinitesi- 
mais das posições r1,...,rw realizados instantaneamente? e com a propriedade de serem 
compatíveis com os vínculos. Em suma, as características definidoras dos deslocamentos 
virtuais são: (i) eles são infinitesimais; (ii) ocorrem num instante t fixo; (iii) não violam 


os vínculos. 


E Exemplo 1.3.1 (Partícula restrita a uma superfície móvel). Seja (1.2.3) a equação da 
superfície. Um deslocamento virtual deve ser consistente com o vínculo, isto é, o ponto r e o 
ponto deslocado r + ór devem pertencer à superfície no instante t: 


fr+ór,t)=0 => fr,)+Vf-ór=0 => Vf-ór=0. (1.3.1) 


Como Vf é perpendicular à superficie no instante t, o deslocamento virtual ôr é tangente à 


superfície nesse instante. E 


Note, contudo, que um deslocamento real dr se dá num intervalo de tempo dt. Por- 


tanto, para que a partícula permaneça na superfície é preciso que 


o 
f@t+dr,i+di)=0 = Vie datat =0. (1.3.2) 
Vê-se, assim, que dr não é tangente à superficie se Of /Ot # 0. Somente o deslocamento 
virtual realizado a tempo fixo é tangente à superfície mesmo que ela esteja em movimento. 


A Figura 1.3.1 ilustra a diferença entre deslocamentos virtual e real para uma partícula 


restrita a uma superfície cuja velocidade no instante t é u. 


A importância de se introduzir a noção de deslocamento virtual advém da seguinte 
observação simples. Se a superfície à qual o movimento da partícula está restrito for 
idealmente lisa, a força de contato entre a partícula e a superfície não possui componente 
tangencial, mas apenas normal à superfície. Desta forma, o trabalho realizado pela força 
de vínculo por ocasião de um um deslocamento virtual da partícula é nulo mesmo que a 
superfície esteja em movimento, diferentemente do trabalho realizado durante um desloca- 
mento real, que não é necessariamente zero. Na maioria dos casos fisicamente interessantes 


o trabalho virtual total das forças de vínculo se anula, como os próximos exemplos atestam. 


8A exigência de que o tempo permaneça fixo confere um caráter fictício aos deslocamentos virtuais, 
embora em muitas situações eles possam corresponder a deslocamentos verdadeiros que ocorrem num 
intervalo de tempo dt, conforme se verá nos exemplos subseqüentes. 
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Figura 1.3.1: Deslocamentos virtual e real de partícula em superfície móvel. 


a Exemplo 1.3.2 (Duas partículas unidas por uma haste rígida). Sejam fı e f2 as forças 
de vínculo sobre as partículas, com fı = —f pela terceira lei de Newton e tanto fı quanto fə 
dirigidas ao longo da reta definida pelas partículas. Então o trabalho virtual das forças de vínculo 


2 


e 


OW, =f; - or, + fo - bro = fo - (ôr2 — ór1) . 


Definindo r = r9—r4, a equaçãode vínculo assume a forma (1.2.4), a saber, r?—/? = 0. Em termos 
da variável r a situação equivale àquela discutida no Exemplo 1.3.1. Tomando f(r,t) = r? — 1? 
a Eq.(1.3.1) reduz-se ar - dr = 0. Mas, como fy e r são colineares, existe um escalar À tal que 
f2 = Ar, donde dW, = Ar - ôr = 0. Uma vez que um corpo rígido consiste num vasto número de 
partículas cujas distâncias mútuas são invariáveis, conclui-se que é zero o trabalho virtual das 


forças responsáveis pela rigidez do corpo. E 


E Exemplo 1.3.3 (Corpo rígido rolando sem deslizar sobre uma superfície). De modo geral, 
para que não haja deslizamento é preciso que exista uma força de atrito entre o corpo e a 
superfície, isto é, as superfícies em contato devem ser ásperas. Mas, ao rolar sem deslizar, em 
cada instante as partículas do corpo giram em torno de um eixo que passa pelo ponto de contato 
do corpo com a superfície. Assim, a força de atrito atua sobre um ponto do corpo que em 
cada instante possui velocidade nula, pois encontra-se sobre o eixo instantâneo de rotação. Uma 
vez que qualquer deslocamento virtual do corpo não pode mover o seu ponto de contato com a 
superfície, senão haveria deslizamento com a consequente violação do vínculo, o trabalho virtual 


da força de vínculo é 6W, =f - ôr = 0 porque ôr = 0, muito embora f Æ 0. E 


A análise anterior torna patente que numa ampla gama de situações fisicamente rele- 
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vantes o trabalho virtual total das forças de vínculo é nulo. A situação em que há forças de 
atrito de deslizamento constitui uma exceção. Neste caso a força de vínculo possui compo- 
nente na mesma direção do deslocamento virtual e o trabalho virtual por ela realizado não 
é zero. Por serem de escasso interesse para o desenvolvimento das formulações gerais da 
mecânica, especialmente sob a óptica da física contemporânea, tais casos serão excluídos 
de nossas considerações. De agora em diante vamos nos limitar, sem perda significativa 
de generalidade, à consideração de problemas nos quais o trabalho virtual total das forças 


de vínculo é nulo. 


1.4 Principio de d’Alembert 


A formulação newtoniana da mecânica caracteriza-se pelo conjunto de equações difer- 


enciais 


onde F; é a força total ou resultante sobre a i-ésima partícula, supostamente uma função 
conhecida das posições, velocidades e tempo. Este sistema de equações diferenciais deter- 
mina uma única solução para os r;(t) uma vez especificadas todas as posições e velocidades 


num dado instante inicial. 


Quando há vínculos em ação, saltam aos olhos os inconvenientes da formulação new- 
toniana. Em primeiro lugar, ela geralmente requer o uso de mais coordenadas do que o 
necessário para especificar a configuração do sistema em cada instante. Quando há vínculos 
holônomos, por exemplo, as posições r4,...,ry não são independentes entre si, tornando a 
formulação newtoniana antieconômica ao exigir o emprego de variáveis redundantes. Além 


disso, a força total sobre a i-ésima partícula admite a decomposição 


F =F” 4f, (1.4.2) 


onde Fo é a força aplicada e f; é a força de vínculo. No caso do pêndulo duplo do Exemplo 
1.2.4, FW? e FW? são os pesos das partículas, ao passo que fı e fọ são determinadas pelas 
tensões nos fios. A dificuldade, aqui, reside em desconhecer-se a priori as expressões 
das forças de vínculo como funções das posições e velocidades, pois o que se conhece, na 
verdade, são os efeitos produzidos pelas forças de vínculo. Pode-se argumentar, ainda, 


que as forças aplicadas é que são as verdadeiras causas do movimento, as forças de vínculo 
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servindo meramente para assegurar a preservação das restrições geométricas ou cinemáticas 
no decurso do tempo. Não menos importante é o fato de as leis de Newton revelarem-se 
incapazes de descrever corretamente o movimento de certos sistemas sujeitos a vínculos 


(Stadler 1982). 


Por todos esses motivos, seria desejável obter uma formulação da mecânica clássica 
que fosse a mais parcimoniosa possível, a saber, envolvesse somente forças aplicadas e 
empregasse apenas coordenadas mutuamente independentes. Veremos que tal objetivo é 
alcançado pelo formalismo lagrangiano quando todos os vínculos são holônomos. Como 
passo intermediário para chegar à formulação de Lagrange, iremos discutir o chamado 
princípio de d'Alembert, que constitui um método de escrever as equações de movimento 
exclusivamente em termos das forças aplicadas, e para cuja dedução será explorado o fato 


de que o trabalho virtual das forças de vínculo é nulo. 


Consideremos inicialmente uma situação estática, isto é, um sistema de partículas em 


equilíbrio. Neste caso F; = 0 e, quaisquer que sejam os deslocamentos virtuais ór;, tem-se 


Fazendo uso da decomposição (1.4.2) resulta 


DD Fo e, OV; + 5 f; g ôr; =0. (1.4.4) 


Limitando-nos ao conjunto suficientemente amplo de circunstâncias em que o trabalho 
virtual das forças de vínculo é zero, somos conduzidos ao chamado princípio dos trabalhos 


virtuais: 


SF .6r,=0. (1.4.5) 


Este princípio permite exprimir a condição de equilíbrio para sistemas vinculados em 


termos somente das forças aplicadas.” 


Estamos interessados na dinâmica, que pode ser formalmente reduzida à estática es- 
crevendo a segunda lei de Newton na forma F; — p; = 0, com p; = mit;. Segundo a 


interpretação de d’Alembert, cada partícula do sistema encontra-se em “equilíbrio” sob 


“Ilustrações do seu emprego em casos interessantes encontram-se em Sommerfeld (1952) e Synge & 
Griffith (1959). 
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Figura 1.4.1: Maquina de Atwood 


uma força resultante que é a soma da força real com uma “força efetiva invertida” igual 
a —p;. Esta força adicional fictícia é uma força de inércia existente no referencial que 
acompanha o movimento da partícula, isto é, no qual ela permanece em repouso (Lanczos 
1970; Sommerfeld 1952). Interpretações à parte, o fato é que agora, em lugar de (1.4.3), 


a equação 


>i — Fi) - ôr; = 0 (1.4.6) 
é obviamente verdadeira quaisquer que sejam os deslocamentos virtuais ór;. Usando no- 
vamente a decomposição (1.4.2) e admitindo a nulidade do trabalho virtual das forças de 


vínculo, resulta o chamado princípio de d'Alembert: 


Sp: — FO) -ór,=0. (1.4.7) 

i 
Este princípio representa uma extensão do princípio dos trabalhos virtuais a sistemas 
mecânicos em movimento. No caso de sistemas vinculados, o principio de d’Alembert cons- 
titui um avanço relativamente à formulação newtoniana porque exclui qualquer referência 
às forças de vínculo. Em suas aplicações concretas, no entanto, é preciso levar em conta 
que os deslocamentos virtuais ôr; não são independentes, pois têm que estar em harmonia 


com os vínculos. 


E Exemplo 1.4.1 (Máquina de Atwood). A roldana da Figura 1.4.1 é suposta sem massa e 
sem atrito com o eixo. Com o sistema cartesiano indicado na figura, temos rı = 711, re = ai e 
o vínculo holônomo escreve-se 
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ty +xo=l, 


onde a constante | é determinada pelo comprimento do fio, suposto inextensível e de massa 
desprezível. Claramente, os deslocamentos virtuais 6x; e 6x2 compatíveis com o vínculo estão 
relacionados por 


6x1 + dx9 = 0 6% = — ÔT] . 


Em outras palavras, se uma das massas sobe a outra desce a mesma distância, e vice-versa. Em 
virtude destas últimas equações, temos dr; = 6x11 e rə = zi = —ôxıi = —ôrı. Notando, 
ainda, que ț2 = —ťı e levando todos estes resultados no princípio de d’Alembert, encontra-se 


mr, - 6ry + moto - bro = FO - ory + FO) - Oro = migi - Ory + magi - Oro ; 


ou 


m1%16x1 + (—m2%1)(—d21) = mıgôxı + M2g(—d21) . 


Levando em conta a arbitrariedade de dx, obtém-se a equação de movimento da massa my: 


(ma + mo)ty = (ma = m2)g . 


A aceleração da massa my é dada por 


iy my — ma 
ti = —— 


cz b) 
ma + ma 


que coincide com o resultado obtido pelo tratamento newtoniano elementar. A aceleração de my 


é simplesmente 72 = — t1. E 
Para outras aplicações do princípio de d'Alembert o leitor é remetido a Sommerfeld 


(1952) e Synge & Griffith (1959). 


1.5 Coordenadas Generalizadas e Equações de La- 
grange 


O princípio de d'Alembert ainda exige trabalhar com mais coordenadas do que o 


necessário, pois não apenas os dr; não são independentes como também, em muitos casos, 


1.5. COORDENADAS GENERALIZADAS E EQUAÇÕES DE LAGRANGE 25 


as próprias posições r; . Em sistemas holônomos é possível introduzir um certo número n 
de variáveis independentes, denotadas genericamente por q1,...,Gn € denominadas coor- 
denadas generalizadas, de sorte que: (a) o vetor posição de cada partícula é determinado 
univocamente em cada instante pelos valores dos q's; (b) os vínculos, supostos todos da 
forma (1.2.7), são identicamente satisfeitos se expressos em termos dos q's. Vejamos dois 


casos ilustrativos. 


E Exemplo 1.5.1 (Pêndulo duplo plano). Reconsiderando o Exemplo 1.2.4, uma escolha 
possível de coordenadas generalizadas é q = 91, q2 = 05 (vide Figura 1.2.1). Temos, então, 


zı = lı sen 1 , yy = lı cos 64, £2 = lı sen 6, + losen 62 , yo = lı cos 04 + l2 cos O2 . 


Note que os valores de 0, e 62 especificam univocamente as posições das partículas, isto é, a 
configuração do sistema. Em termos de 6; e 05 as equações de vínculo (1.2.6) reduzem-se às 


identidades 1? sen?6, + I? cos? 6, — 1? = 0 e 12 sen?65 + l2 cos? 09 — 13 =0. E 
1 1 1 2 2 


E Exemplo 1.5.2 (Partícula restrita à superfície de uma esfera em movimento uniforme). 
Seja u = (uz, Uy, Uz) a velocidade constante da esfera em relação a um referencial inercial. No 
instante t o centro da esfera tem coordenadas (ugt, uyt, uzt) e a equação de vínculo tem a forma 


£ — Uzt)? + Yy — uyt)? + z—u,t)?- R?=0, 
y 


sendo R o raio da esfera. Introduzindo os ângulos 0 e y pelas equações 


£ = Uzt + Rsenð cos Y , y= uyt + Rsend seng , z = uzt + Rcos 0 , 


a equação da vínculo passa a ser identicamente satisfeita. Portanto, q = 0 e q2 = ọ constitui 


uma escolha possível de coordenadas generalizadas. E 


Seja um sistema mecânico constituído por N partículas submetidas aos p vínculos 


holônomos 
filra,.. E Part) = 0 5 
(1.5.1) 
Tie rẸ,t)=0. 
Das 3N coordenadas (21,1, 21), .--, (N, YN, ZN) apenas n = 3N—p podem ser tomadas 


como independentes entre si, e diz-se que o sistema possui n graus de liberdade. E possível 


introduzir n coordenadas generalizadas q1,...,Gn em termos das quais 
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PS PGi Gh) tS a A (1.5.2) 


e as Egs.(1.5.1) são identicamente satisfeitas. Em linguagem geométrica, pode-se dizer 
que as Eqs.(1.5.1) definem uma hipersuperfície de dimensão n num espaço de dimensão 


3N e que (1.5.2) são as equações paramétricas dessa hipersuperfície. 


Cada conjunto de valores atribuídos às coordenadas generalizadas define uma con- 
figuração do sistema, isto é, as posições de todas as partículas num dado instante. O espaço 
cartesiano que tem as coordenadas generalizadas como eixos coordenados é chamado de 
espaço de configuração do sistema. A representação do espaço de configuração como um 
espaço cartesiano é apenas simbólica, no entanto. Por exemplo, no caso de uma partícula 
restrita à superfície de uma esfera e descrita pelas coordenadas esféricas angulares (0,9), 
uma única configuração corresponde à infinidade de pontos 0 = 7/2 com y arbitrário. 
A rigor, o espaço de configuração possui a estrutura matemática de uma variedade difer- 
enciável, daí ser também chamado de variedade de configuração. Diz-se, ainda, que um 
sistema mecânico holônomo tem tantos graus de liberdade quantas sejam as coordenadas 


generalizadas necessárias e suficientes para especificar a sua configuração em cada instante. 


Uma vez introduzidas coordenadas generalizadas via (1.5.2), os deslocamentos virtu- 
ais ôr; podem ser expressos em termos dos deslocamentos virtuais independentes dq, 


mediante 


da Or; 


dr; =>, 


p= OFk 


Odk » (1.5.3) 


já que o tempo deve permanecer fixo.!º Por outro lado, 


dr; % ) 
a id. 1.5.4 
VE aê Ag ET Bt oe) 


k 


Tendo em vista que as forças de vínculo não aparecem no principio de d’Alembert, de 
ora em diante abandonaremos o superescrito identificador das forcas aplicadas, isto é, 
adotaremos a notação abreviada FO = F,. Usando (1.5.3), o trabalho virtual das forças 


aplicadas torna-se 


100s deslocamentos virtuais podem ser entendidos como vetores tangentes ao espaço de configuração 
encarado como variedade diferenciável, evitando o uso de quantidades infinitesimais (Arnold 1976; José 
& Saletan 1998). 
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aa 


i k 


onde 


Or; 
Qe= Fi: (1.5.6) 


é, por definição, a k-ésima componente da força generalizada. Como os q’s nao têm 
necessariamente dimensão de comprimento, os Q’s não têm necessariamente dimensão de 


força. Mas cada termo Qg dq, tem sempre dimensão de trabalho. 


A outra quantidade envolvida no princípio de d' Alembert é 


> pesn Yo mv ore MN em (1.5.7) 


i 


A seguinte identidade será útil: 


Or; d Or; d / Or; 
dm v; ai, = TY Flow : TR — mv; O) : (1.5.8) 


No ultimo termo de (1.5.8) podemos usar o resultado 


d Or; ð Or. | O Ori) Or; . _ oO; Ov; 
ion) = ag (on) de (amo) = Bag Bet) = go (159) 


onde utilizamos (1.5.4) e passamos a tratar os q's e q's como grandezas independentes, 
de modo que as derivadas parciais em relação aos q's tratam os q’s como constantes e 


vice-versa. Além disso, de (1.5.4) deduz-de imediatamente 


ONO 
dj Oq | 


(1.5.10) 


permitindo escrever (1.5.8) na forma 
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_ Ori d Ovi Ovi 
= “Lac dma] -Gma = 5 oT OE 
onde 
1 2 
ae 2 Domini; (1.5.12) 


é a energia cinética do sistema. Podemos supor que a energia cinética T e as componentes 
Q, da força generalizada estejam expressas exclusivamente em termos dos q’s e q's por meio 
das Eqs.(1.5.2) e (1.5.4). Levando (1.5.5), (1.5.7) e (1.5.11) em (1.4.7) somos conduzidos 


a 


d ,OT oT 
a — ôq =D, 1.5.13 
- ni da Qu} dk ( ) 
Como os dq’s são mutuamente independentes e arbitrários, esta última igualdade só pode 


ser satisfeita se o coeficiente de cada dq, for zero. Inferimos, assim, as n equações 


d (22) OT 


— = | aod ee 1.5.14 
dt On. oq Qk , , ni, ( ) 


as vezes chamadas de equações de Lagrange. Reservaremos esta designação, no entanto, 


para as situações mais importantes em que as forças aplicadas derivam de um potencial. 


Na ausência de vínculos as Eqs.(1.5.14) permanecem válidas e representam a segunda 
lei de Newton expressa num sistema de coordenadas curvilíneas arbitrário, conforme pas- 


samos a ilustrar. 


E Exemplo 1.5.3 (Partícula no espaço em coordenadas cartesianas). O vetor posição da 
partícula é r = xi+y)+zk, de modo que as coordenadas generalizadas são q1 = £, q2 = Y, q3 = Z 
e as componentes da força generalizada são 


QE QE P>=Fi=E,QG=E,Q=E. 


A energia cinética é 
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Figura 1.5.1: Partícula num plano em coordenadas polares 


2 
donde: 
OT . oT >. oT . OT OT OT 0 
— =m = S= > Zmz, = = = é 
d o og Po az ðr Oy dz 
As Egs.(1.5.14) tomam a forma 
d d d . 
ym) Fy , qn) Fy ’ qn) = F; , 
e recuperamos, assim, as equações de movimento newtonianas em sua forma original. E 


E Exemplo 1.5.4 (Partícula num plano em coordenadas polares). O vetor posição da 
partícula escreve-se r = r cos 0i +r sen 0), e as componentes da força generalizada são 


Or 


Q= Qr =F. 2 =F (cos 0i+ sen 0ĵ) =F-é, =F, à 
r 
ðr 3 E x 
Oo = =F; a, = rF - (— sen ĝi + cos 05) = rF - êọ = r Fọ 3 
onde & = cos 6i+ sen0j e ég = — sen 0 Î+cos Oj são os unitários radial e angular representados 


na Figura 1.5.1. Usando 
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i=rcos0-rôsend , y=7senb+récos 6 , 


a energia cinética expressa em termos de coordenadas polares é 


P= 


(à? FP) = a + 1262). 


Portanto as Eqs.(1.5.14) assumem a forma 


d /O0T oT A : 
a) E mtos 
ala) 00 = % gle) =15o - 


Verifica-se prontamente que rfg é a componente normal ao plano do movimento do torque 
em relação à origem, enquanto que mr20 é a componente correspondente do momento angular. 
Desenvolvendo explicitamente a derivada temporal, as equações de movimento anteriores tornam- 
se 


më — mr? = F, , mrô+2miô=F, (1.5.15) 


que são simplesmente as componentes polares da equação de movimento de Newton (Symon 
1971). E 


As equações (1.5.14) adquirem uma forma particularmente concisa e elegante quando 


as forças F; derivam de um potencial escalar V(r,,...,rn,t). Neste caso, 


OV; OV; oV; 
F; = -V;V = =a 2 TA (1.5.16) 
e as forças generalizadas escrevem-se 
Qr 2 odk DE dq Oy; On dz dq) odk ( ? y 


onde usamos a regra da cadeia da diferenciação. Com o emprego das Eqs.(1.5.2) o potencial 
V exprime-se como função exclusivamente dos q’s, sendo independente das velocidades 


generalizadas. Inserindo (1.5.17) em (1.5.14) resulta 
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o 


TS ae =0. (1.5.18) 


Dado que OV/0q, = 0, estas últimas equações são equivalentes a 


ad | O o 
afago =) - e-v- (1.5.19) 


Definindo a função de Lagrange ou, simplesmente, lagrangiana L por 


LaLa (1.5.20) 


as equações de movimento do sistema podem ser escritas na forma 


at!) OL 


— = Silea i 1.5.21 


Daqui por diante sempre nos referiremos às Eqs.(1.5.21) como equações de Lagrange.!! 


As Egs.(1.5.21) constituem um sistema de n equações diferenciais ordinárias de 
segunda ordem que determinam univocamente os q(t) desde que sejam dadas as 2n 
condições iniciais qı(to), .--,qn(to) e di(to),---,@n(to) num instante inicial to. Uma vez 
determinadas todas as coordenadas generalizadas em função do tempo, a posição de 
cada partícula do sistema em qualquer instante t determina-se por meio das Eqs.(1.5.2). 
As equações de Lagrange fornecem o meio mais econômico de escrever as equações de 
movimento, pois envolvem o número mínimo de coordenadas, além de eliminar qualquer 
referência às forças de vínculo (o potencial V na lagrangiana (1.5.20) refere-se apenas às 
forças aplicadas). Em lugar das forças e acelerações vetoriais que caracterizam a abor- 
dagem newtoniana, no método de Lagrange basta lidar com duas funções escalares, T 
e V, o que introduz enormes simplificações no tratamento de problemas mecânicos. As 
equações de Lagrange possuem a vantagem adicional de serem válidas para uma escolha ar- 
bitrária das coordenadas generalizadas, a escolha em cada situação específica sendo ditada 


por razões de conveniência e simplicidade. 


Embora a invariância das equações de Lagrange sob uma transformação geral de co- 


ordenadas seja evidente da dedução feita acima, uma demonstração direta é instrutiva. 


HNascido na Itália de uma família de origem francesa pelo lado paterno, Joseph Louis Lagrange foi um 
dos maiores matemáticos de sua época. As equações de Lagrange vieram a lume em 1788 no seu grande 
livro Mécanique Analytique, no qual o tratamento adotado era puramente analítico. No prefácio Lagrange 
dizia, com orgulho, que sua obra não continha nenhum diagrama. 
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Se Q1,...,Qn sao novas cordenadas generalizadas que são funções arbitrárias das coor- 
denadas generalizadas originais g),...,q,, temos!? 
Qk = GAG coast) ec k=1,...,n (1.5.22) 


e, inversamente, 


qk = hQr, Qnm t) , K=1,...,.n. (1.5.23) 


A mudança de coordenadas (1.5.22) é conhecida como uma transformação de ponto porque 
mapeia pontos do espaço de configuração definido pelos q’s em pontos do espaço de con- 
figuração definido pelos Q’s. Na terminologia matemática, um mapeamento bijetivo dife- 
renciável G com inverso g = G7! também diferenciável constitui um difeomorfismo, e o 


espaço de configuração dos Q’s é dito difeomorfo ao espaço de configuração dos q’s. 


Diferenciando a Eq.(1.5.23) relativamente ao tempo resulta 


dg à +o 
=> 50 50,° (1.5.24) 
donde Ae 5 
dk dk 
E 1.5.25 
dQ, OQ l ) 


A lagrangiana transformada L(Q, Q,t) é simplesmente a lagrangiana original L(q,q,t) 


expressa em termos de (Q, Q, t): 


L(Q, Q,t) = L(q(Q,t), 4(Q,Q,t),t) . (1.5.26) 


Como ôqk/ dQ) = 0, podemos escrever 


E H da OL a) _ 5 ÎL da, (1.5.27) 


Od OQ; Oq dQ; E E djr OQ: 


00; SG 


donde 


12 Apesar da notação coincidente, estes Q’s não devem ser confundidos com as componentes da força 
generalizada. 
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d(OL\ [ad ALy dq, OLA Om] — Bld /OLy dg , OL Dax 
alea Da OG aan) - Clio) do “Ok zi ne 


k 


onde usamos a Eq.(1.5.9) com q no lugar de r; e Q; no lugar de q. Combinando esta 


última equação com 


OL OL Og; | OL “i 
E Fa 1.5.29 
0Qi 2 0Qi dr OD: ( ) 
resulta 
df(OL\ E /OLy OL) dq, | 
dt o) OQ DECS ~ a A 0, (1.5.30) 


completando a demonstração. Em linguagem matemática: as equações de Lagrange são 


invariantes sob difeomorfismos. 


Vale ressaltar que, embora possa ser expressa em termos de coordenadas generalizadas 
arbitrárias, a lagrangiana L = T — V tem que ser escrita inicialmente em termos de 


coordenadas e velocidades relativas a um referencial inercial. 


1.6 Aplicações das Equações de Lagrange 


O procedimento que deve ser seguido para se escrever as equações de Lagrange associ- 
adas a um dado sistema mecânico é simples. Em primeiro lugar precisam ser escolhidas co- 
ordenadas generalizadas q1,...,Gn. Em seguida, as energias cinética e potencial devem ser 
expressas em termos dos q's e q's apenas, de tal modo que a lagrangiana L = T—V também 
fique expressa somente em função das coordenadas e velocidades generalizadas. Basta, fi- 
nalmente, calcular as derivadas parciais pertinentes de L, introduzi-las nas Eqs.(1.5.20), e 
está concluído o processo de construção das equações de movimento do sistema. Conside- 


remos algumas ilustrações desse procedimento. 


E Exemplo 1.6.1 (Máquina de Atwood). Utilizando as coordenadas do Exemplo 1.4.1, o 
vínculo zı + z2 = | mostra que somente uma das duas coordenadas 71, 72 pode ser tomada como 
coordenada generalizada (o sistema só possui um grau de liberdade). Escolhamos qi = x1 como 
coordenada generalizada. A energia cinética do sistema é 
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Figura 1.6.1: Conta deslizando ao longo de uma haste horizontal girante. 


porque de rg = | — x, deduz-se ty = —%,. Adotando o nivel zero do potencial gravitacional no 
plano horizontal que passa pela origem dos eixos coordenados, temos 


V = —mygz1 — magro = —migx1 — mag(l — z1) = —(m1 — mo)gxy — Məgl , 


pois pontos situados abaixo do nível zero têm potencial gravitacional negativo. À lagrangiana é 
dada por 


my + ma .s 


L= 5 ti + (my — mo)gxy + magl 


e a única equação de Lagrange é 


d / OL OL 
Ra xı (mı + m2)ťı (ma m2)g 
A aceleração de mı coincide com a obtida por aplicação do principio de d’Alembert. = 


E Exemplo 1.6.2 (Conta deslizando ao longo de uma haste retilínea lisa que gira com veloci- 
dade angular constante num plano horizontal). Seja xy o plano horizontal que contém a haste e 
usemos coordenadas polares para localizar a conta de massa m (ver Figura 1.6.1). As variáveis 
r,0 não podem ser tomadas como coordenadas generalizadas porque 0 é forçado a obedecer à 
restrição 0 — wt = 0, que é um vínculo holônomo da forma (1.2.7), onde w é a velocidade an- 
gular constante da haste, suposta conhecida. O sistema possui somente um grau de liberdade 
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(movimento radial) e podemos escolher qı = r como coordenada generalizada. De acordo com o 
Exemplo 1.5.4, a energia cinética pode ser posta na forma 


T= (PAR) = SP + ur?) , 


onde usamos 6 = w. Adotando o nivel zero do potencial gravitacional no plano do movimento, 
a lagrangiana do sistema reduz-se a energia cinética: 


L=T-V =T (P +r?) : 


Dispondo da lagrangiana expressa exclusivamente em função de r e 7, a equação de movimento 
do sistema é imediatamente obtida: 


(5) = at =0 = L (mi) = mw? 


r=0 = f=o'r. 


Conclui-se que a conta tende a afastar-se do eixo de rotação em conseqiléncia da “força centrífuga”, 


que é o resultado bem conhecido. E 


1.7 Forças de Vínculo no Caso Holônomo 


Um dos objetivos atingidos pelo formalismo lagrangiano, no caso holônomo, é o bani- 
mento de qualquer menção às forças de vínculo nas equações de movimento. Em certas 
situações, no entanto, pode ser de interesse obter as forças de vínculo. Para o engenheiro, 
a determinação de tais forças é essencial para a escolha de materiais capazes de suportar 
as tensões envolvidas. Já que o método de Lagrange não fornece qualquer informação a 
respeito das forças de vínculo, a fim de determiná-las precisamos retornar à formulação de 


Newton. 


Introduzindo a decomposição (1.4.2) nas equações newtonianas de movimento (1.4.1) 


e resolvendo para as forças de vínculo, resulta 


f, = mi; = Fo 5 (1.7.1) 


onde voltamos a utilizar o superescrito para identificar as forças aplicadas. Estas últimas 


são conhecidas por hipótese, bastando obter as acelerações fr; para determinar f;. No 
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caso holônomo as forças de vínculo podem ser encontradas através da seguinte receita: (i) 
calcule as acelerações ï; tomando a segunda derivada temporal das Egs.(1.5.2) e elimine as 
acelerações generalizadas q apelando para as equações de Lagrange (1.5.21); (ii) calcule 
as forças aplicadas por intermédio da Eq.(1.5.16); (iii) leve os resultados dos dois passos 


anteriores em (1.7.1) para obter as forças de vínculo. 


E Exemplo 1.7.1. (Tensão no fio da máquina de Atwood). A aceleração da massa mı é 


onde a equação de Lagrange do Exemplo 1.6.1 foi usada para exprimir %. Como segundo passo, 
escrevemos FO = mygi (peso da partícula de massa mı). Finalmente, levando estes resultados 
em (1.7.1) vem 


é 3 mimo ; 
fi = mir, — migi = —-————— ai, 
ma + ma 
o sinal negativo indicando que a tensão no fio aponta verticalmente para cima. E 


E Exercício 1.7.1. Repita o procedimento anterior para a mass m2 e mostre que a força 


que o fio exerce sobre ela é a mesma que exerce sobre a massa mı. E 


E Exemplo 1.7.2 (Força de vínculo sobre a conta do Exemplo 1.6.2). (a) Componentes 
cartesianas. Temos r = Xi + yj onde 


d? 

ï = — (r cos wt) = F cos wt — 2wt sen wt — w2r cos wt , 
dt? 
2 

ü= qa sen wt) = FP sen wt + Iwr cos wt — w rsen wt . 


Usando a equação de Lagrange do Exemplo 1.6.2, encontra-se 


i = —2wř sen wti + 2w7 cos wtj ; 


Já que não há forças aplicadas, a Eq.(1.7.1) fornece 
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Figura 1.7.1: Partícula deslizando ao longo de um aro fixo sem atrito. 


f = mi = —Imwi sen wti + 2mw* cos wtj ; 


(b) Componentes polares. Segundo a última equação acima, as componentes polares de f são 
o produto da massa pelas componentes correspondentes da aceleração da conta. Mas, pelas 
Eqs. (1.5.15), 


fr = më — mr? = më — mw?r , 


fo= mrô + 2mrd = Imwr , 


onde usamos 6 = wt, donde É = w e 6 = 0. Com a ajuda da equação de Lagrange É = w2r 


resulta, finalmente, 


fr=0 , fo =2mur . 


A força de vínculo é perpendicular à haste, um resultado esperado em vista da hipótese de 


inexistência de atrito de deslizamento entre a conta e a haste. E 


Em alguns problemas a determinação das forças de vínculo é imprescindível para que 


se possa responder a certas perguntas quanto ao comportamento dinâmico do sistema. 


E Exemplo 1.7.3. Uma partícula, partindo do repouso, cai do topo de um aro vertical liso 
fixo. Em que ponto a partícula abandona o aro? 


Solução. Com o uso das coordenadas r e 0 da Figura 1.7.1, vemos que o vínculo r= R 
é satisfeito durante a fase do movimento em que a partícula permanece em contato com o aro. 
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O sistema tem um único grau de liberdade e podemos tomar 6 como coordenada generalizada. 
Recorrendo ao Exemplo 1.6.2, a energia cinética assume a forma 


. 2 . 
T= (ir pre T 


pois 7 = 0. A energia potencial é V = mgR cos 6, de modo que 


mR? 


L= 6? —mgRcos 0 . 


A equação de Lagrange para 0 é facilmente obtida: 
mR?6 —-mgrsen6 =0 . 
A reação do aro sobre a partícula é dada por 
f = mi — (—mgi) . 


cujas componentes polares sao 


fr = mi — mr? + mgr cos 0 , 


fo = mrô + 2mřÅ — mgr sen6 , 


onde usamos i-é€,; = cos 0 e j-€g = —sen@. Devido ao vínculo r = R e à equação de Lagrange 
para 0, estas últimas equações reduzem-se a 


f=-mRô2+mgcos0 , fo=0, 


mostrando que a força de reação é perpendicular ao aro. A partícula perde o contato com o aro 
no instante em que fr = 0. Para descobrir para que valor de @ isto acontece, precisamos exprimir 
0 em termos de 6, o que pode ser conseguido pela conservação da energia: 


R2. 
E=T+V = “0 + mgR cos d=mgR , 
porque no instante inicial 0 = 0 e 6 = 0. Então, 


mR? = 2mg(1 — cos 0) , 
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de modo que 


fr=mg(3cos 0 — 2) . 


A reação normal do aro anula-se para 0 = cos !(2/3), correspondendo aproximadamente ao 


ângulo 0 = 48°11’. E 


A metodologia aqui descrita para a determinação das forças de vínculo só é aplicável 
se todos os vínculos forem holônomos e envolve uma mistura deselegante dos formalismos 
de Lagrange e Newton. É possível, permanecendo inteiramente no contexto do formalismo 
lagrangiano, no caso holônomo e para uma classe importante de vínculos não-holônomos, 
obter as forças de vínculo pelo método dos multiplicadores de Lagrange, a ser discutido 


no próximo capítulo. 


1.8 Potenciais Generalizados e Função de Dissipação 


Quando as forças generalizadas resultam de uma função U (q1, --- , qn, (1; - - - , Qn, t) por 


meio das expressões 


(1.8.1) 


então as Eqs.(1.5.14) ainda implicam as Eqs.(1.5.21) com a lagrangiana definida por 


L=T-U. (1.8.2) 


A função U é chamada de potencial generalizado ou potencial dependente das veloci- 
dades. A classe de forças abrangida pela Eq.(1.8.1) é mais ampla do que o conjunto das 
forças conservativas, estas últimas constituindo o caso particular em que U independe 
das velocidades generalizadas e do tempo. A admissão de forças dedutíveis de potenciais 
generalizados não é fruto de um desejo meramente acadêmico de buscar a máxima genera- 
lidade sem consequências físicas: a força eletromagnética sobre uma carga em movimento 
admite um potencial generalizado. Em virtude de sua enorme importância, este assunto 


merece uma discussão detalhada. 


A força experimentada por uma carga elétrica e em movimento num campo eletro- 


magnético externo é a força de Lorentz (em unidades CGS gaussianas) 
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F = e(E+ - xB). (1.8.3) 


As equações de Maxwell permitem escrever os campos em termos de um potencial escalar 


ó(x,t) e de um potencial vetor A(r,t) da seguinte maneira (Marion & Heald 1980): 


13A 
E=-Vóo--— , B=VxA. (1.8.4) 
c Ot 
Utilizando como coordenadas generalizadas as próprias coordenadas cartesianas da partí- 
cula, as componentes da força generalizada coincidem com as componentes cartesianas da 


força de Lorentz. Considere, portanto, 


194 1 
F=e[-Vê- 5 + ov x (vx ay} (1.8.5) 


Pretendemos mostrar que F pode ser representada na forma (1.8.1) para alguma função 
U. Mas em (1.8.1) aparece uma derivada total em relação ao tempo, ao passo que em 
(1.8.5) a derivada é parcial. Podemos introduzir uma derivada total em (1.8.5) notando 


que 


dA OA OA OA OA OA 
ie or Po oe a ee) 
Usando ainda 
vx B=vx (Vx A) = V(v.A)-v.VA , (1.8.7) 


pois o operador nabla só afeta as variáveis de posição,*º a Eq.(1.8.5) reduz-se a 


1dA 1 


Com o uso do operador V, = 19/04+j0/0-+kô/0z e levando em conta que as coordenadas 


e velocidades generalizadas são tratadas como quantidades independentes, ficamos com 


Em geral vale a identidade V(a-b)=(a-V)b+(b-V)a+ax(Vxb)+bx(V xa). 
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pois @ e A não dependem da velocidade. 


Portanto, F é da forma (1.8.1) com 


U-eG-“vA, (1.8.10) 
C 


de modo que 


2 
berets T- b+ “vA (1.8.11) 
C 


é a lagrangiana de uma partícula carregada num campo eletromagnético externo. 


Se as forças generalizadas são da forma 


DE 


Qk = a 


+ Ok» (1.8.12) 


onde Qj, denota a parte das forças generalizadas que não provém de nenhum potencial 


generalizado, as equações de movimento (1.5.13) tornam-se 


d /OL OL 
= =Q 1.8.1 
ATT (1.8.13) 


com L =T —U. Um caso de certa importância é aquele em que os Qj, representam forças 


de atrito viscoso proporcionais às velocidades das partículas. Em componentes cartesianas, 


E: = — KigVir E i = —kiyViy 5 i = —kizUiz 5 (1.8.14) 


onde Fº é a força dissipativa sobre a i-ésima partícula e kiv, kiy, kiz são constantes pos- 


wy) 
itivas. Para facilitar um tratamento mais geral de tais situações, Rayleigh introduziu a 


chamada função de dissipação definida por 


1 


KA 
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de tal modo que 


OF OF OF 
felis Se ES «1 iE 2 e e 
we OVix , Wiy , a Oviz 


(1.8.16) 


Considerando-se o trabalho realizado pelas forças dissipativas emerge o significado físico 


da função de dissipação de Rayleigh: 


dW” 
dw’ = 2, F’ . dri = 2 F; . v,dt = HE Ss Di hiedin + EA + kizu?) = DF , 


a 


de sorte que 2F é a taxa de dissipação da energia do sistema. 


A parte dissipativa das forcas generalizadas pode ser escrita como 


Or; F' Ov; OF Oviz OF 00x; OF Ovi. 


a i 


onde usamos (1.5.10) e a regra da cadeia da diferenciação. Com este último resultado, as 


equações de movimento (1.8.13) transformam-se em 


d ;ðL ðL oF 
(aa) 


oat Naa t=— =0 1.8.17 
dt \ðåk dq:  Oåk l ) 


A principal vantagem — e, provavelmente, única — de se lançar mão de F é que ela 
permite escrever as equações de movimento na mesma forma (1.8.17) em qualquer sistema 


de coordenadas generalizadas. 


E Exemplo 1.8.1 (Péndulo simples com resistência do ar proporcional à velocidade). Usando 
coordenadas polares no plano xy da Figura 1.8.1, temos r = £ e, de acordo com o Exemplo 1.5.3, 
T = mt292/2. Como V = —mgt cos 0, resulta 


me? 


L= -7 & + mgl cos 0. 


Por outro lado, 


me. 2_1 292 
F = hu = Shee 
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Figura 1.8.1: Pêndulo simples 
supondo kz = ky =k, =k. A equação (1.8.17) para 0 toma a forma 
pao enh ; 
m £ 


No caso de pequenas oscilações esta equação de movimento se reduz à de um oscilador harmônico 


amortecido. = 
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PROBLEMAS 


1.1. Uma conta de massa m desliza sem atrito ao longo de uma haste rigida, de massa 
desprezivel, que gira num plano vertical com velocidade angular constante w. Mostre que, 


com uma escolha adequada da coordenada r, a lagrangiana do sistema é 


m mu” s 


o le 5 r° — mgrsenwt . 


Dadas as condições iniciais r(0) = ro, 7(0) = 0, encontre a solução da equação de Lagrange 


para r. Determine, também, a força de vínculo sobre a conta. 


1.2. Mostre que a lagrangiana para o pêndulo duplo plano representado na Fig. 1.2.1 é 


A gi 
2 


ie 6? | > l; 63 t+ molila 01 05 cos(01 — 05) + (my + mo)gly cos 1 + Mggle cos 0» 


e escreva as equações de Lagrange correspondentes. 
1.3. Obtenha a lagrangiana e as equações de Lagrange para um pêndulo esférico, isto é, 
uma massa m suspensa por um fio leve e inextensível de comprimento £ cujo movimento 


não está restrito a um plano. 


1.4. O pêndulo cicloidal de Huyghens consiste numa partícula oscilando num plano 


vertical ao longo de um arco de ciclóide com equações paramétricas 


x=RO+Rsend , y=-Rcos6. 
Mostre que a lagrangiana desse sistema pode ser posta na forma 
2.29 j2 
L = 2mRº cos 5 9º + mgR cosé . 


Fazendo a transformação de ponto u = sen (0/2), obtenha a lagrangiana e a equação 
de Lagrange em termos da coordenada u. Prove que o período de oscilação é igual a 


2n(R/g)'/?, independente, portanto, da amplitude 6o. 
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Figura 1.8.2: Maquina de Atwood oscilante. 


1.5. Considere a máquina de Atwood oscilante representada na Fig. 1.8.2. Usando as 


coordenadas indicadas na figura, mostre que a lagrangiana é dada por 


M x 
= e re 4 SÊ? — gr(M — meos0) 


L 


e escreva as equações de Lagrange. 


1.6. Uma partícula cai verticalmente sob a ação da gravidade. Supondo que a força 
de resistência do ar seja proporcional à velocidade, obtenha a equação de movimento da 
partícula com a ajuda da função de dissipação F = Av?/2. Determine a velocidade como 
função do tempo e prove que a maior velocidade possível para queda a partir do repouso 


év=mg/A. 


1.7. Certos sistemas dissipativos simples admitem uma formulação lagrangiana que dis- 
pensa o emprego da função de dissipação de Rayleigh. Mostre que a equação de movimento 


do problema anterior pode ser obtida da lagrangiana 


1.8. O ponto de suspensão de um pêndulo de massa m e comprimento é pode mover-se 
horizontalmente ligado a duas molas idênticas de constante elástica k. (a) Escolhendo 
como coordenadas generalizadas o deslocamento «x do ponto de suspensão e o ângulo @ 


entre o fio e a vertical, encontre a lagrangiana e as equações de movimento. (b) Obtenha 
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Figura 1.8.3: Problema 1.8. 


a forma aproximada das equações de Lagrange no caso de pequenas oscilações angulares 
(sen? = 6, cos@ = 1 e termos do tipo 6” ou 6” com n > 1 são desprezíveis). Combi- 
nando as equações de movimento aproximadas, mostre que x = a6 para um certo valor 
da constante a. Mostre, em seguida, que o sistema equivale a um pêndulo simples de 


comprimento ¢’ e exprima ¢’ em termos de /,m,g,k. 


1.9. Na eletrodinâmica de Weber a força entre duas cargas elétricas em movimento é 


dirigida ao longo da linha que as une e tem magnitude 


onde r denota a distância entre as partículas carregadas e c é a velocidade da luz no 
vácuo. Determine o potencial generalizado U(r,17) associado a essa força. Escreva a 
lagrangiana e as equações de Lagrange para o movimento num plano de uma carga na 
presença de outra carga fixa na origem do sistema de coordenadas. Embora conduza à 
expressão correta para a lei da Faraday e para a indutância de circuitos elétricos, a força 
de Weber implica que em certas situações uma carga se comporta como se sua massa fosse 
negativa (Maxwell 1954; Whittaker 1951). 


1.10. Um pêndulo elástico consiste numa massa m capaz de oscilar num plano vertical 
suspensa por uma mola de constante elástica k e comprimento natural /. Escolhendo 


coordenadas generalizadas convenientes, obtenha a lagrangiana e as equações de Lagrange. 


1.11. Um pêndulo de massa m e comprimento l está suspenso por um ponto que 
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Figura 1.8.4: Problema 1.12. 


executa oscilações horizontais da forma x = acoswt. Obtenha a lagrangiana em termos 
do ângulo 6 que o fio faz com a direção vertical orientada para baixo. Escreva a equação 
de movimento e mostre que, para pequenos valores de 0, ela reduz-se à de um oscilador 
harmônico forçado. Encontre uma solução estacionária da forma 6 = Og coswt. Como a 


amplitude ĝo depende de m, £, a e w? O que acontece quando w = (g/0)!/?? 


1.12. Considere o sistema representado na Fig. 1.8.4. O bloco de massa m desliza sem 
atrito ao longo da cunha de massa M e ângulo a. A cunha, por sua vez, desliza sem 
atrito ao longo de uma superfície horizontal.(i) Escolhendo coordenadas generalizadas con- 
venientes, obtenha a lagrangiana e as equações de movimento do sistema. (ii) Determine a 
aceleração da cunha relativamente ao sistema de referência inercial (x,y). (iii) Determine 


a aceleração do bloco em relação à cunha. 


1.13. Uma partícula num campo gravitacional uniforme g = —gk está restrita a mover- 
se na superfície de um parabolóide de revolução definido pela equação z = p?/R, onde R 
é uma constante positiva e (p,0,2) são coordenadas cilíndricas. Obtenha a lagrangiana e 
as equações de Lagrange. Prove que a projeção do raio vetor da partícula sobre o plano 
xy varre áreas iguais em tempos iguais. Determine a força de vínculo que age sobre a 


partícula. 


1.14. Prove que a lagrangiana de Bateman (1931) 
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gera a equação de movimento de um oscilador harmônico amortecido. Mostre que a trans- 


At/2 


formação de ponto q = e“/*x elimina a dependência temporal explícita da lagrangiana. 


1.15. Demonstre que a lagrangiana 


m . e 

= 5 (72 + 129º + 127º sen76) — E cos 0 
c 

descreve o movimento de uma partícula carregada no campo B = gr/r? de um monopolo 


magnético. Sugestão: verifique que o potencial vetor de um monopolo magnético em 


coordenadas esféricas tem componentes A, =0, Ag =0 e Ap = g(1 — cos 0)/r sen 0. 


Capitulo 2 


PRINCIPIO VARIACIONAL DE 
HAMILTON 


Desde que existe como ciência, a Física tem como seu objetivo mais cobiçado a 
solução do problema de condensar todos os fenômenos naturais num único princípio. 
Dentre as leis mais ou menos gerais que marcam as conquistas da ciência física 
durante o curso dos últimos séculos, o princípio da mínima ação é talvez aquele que, 
no que se refere à forma e ao conteúdo, mais se aproxima desse objetivo final da 
pesquisa teórica. 


Max Planck 


De todas a formulações da dinâmica clássica, a mais concisa tem a forma de um 
princípio variacional. Conforme idéias típicas do século XVIII, das quais Maupertuis foi 
um dos pioneiros, dentre todas as alternativas à sua disposição a natureza segue o curso 
mais econômico de acordo com algum critério de comparação entre as diversas possibili- 
dades. O princípio diferencial de d’Alembert, do qual se deduzem as equações de Lagrange, 
exprime a lei fundamental do movimento em termos da configuração instantânea do sistema 
e de desvios infinitesimais da referida configuração. É possível reformular a lei dinâmica 
fundamental como um princípio integral, que leva em conta o movimento completo do 
sistema durante um intervalo de tempo finito. O princípio de Hamilton reduz as leis da 
mecânica a um enunciado segundo o qual, comparado com todos os movimentos ima- 
gináveis, o movimento real é aquele para o qual é mínima (mais geralmente, estacionária) 
uma certa quantidade — a ação — cujo valor depende do movimento do sistema em 
sua totalidade. A formulação precisa do princípio de Hamilton ou princípio da mínima 
ação requer uma breve incursão por um importante ramo da Matemática conhecido como 


cálculo das variações . 
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2.1 Rudimentos do Cálculo das Variações 


O cálculo das variações ocupa-se com o problema de determinar extremos, isto é, 
máximos ou mínimos, de funcionais. Um funcional é uma função real cujo domínio é 
um espaço de funções. Mais explicitamente, um funcional associa um número real a cada 


função de um certa classe de funções para as quais o funcional está definido. 


E Exemplo 2.1.1. Sejam (71,41) e (x2, y2) dois pontos distintos num plano, com x2 > 24. 
Seja y(x) uma curva ligando esses dois pontos. Uma vez que o comprimento de arco infinitesimal 


no plano é 
dé = (d+ dy? = 4/14 ey di 


o comprimento de arco da curva entre os pontos inicial e final é 


Lly] = pe V1+y'(2)2 dz . (2:1:1) 


O comprimento de arco £ é um funcional de y, isto é, dada uma função continuamente diferen- 


ciável y(x) a ela se faz corresponder o único número real [y] definido pela Eq.(2.1.1). E 


O mais simples de todos os problemas do cálculo das variações pode ser assim formu- 


lado: sendo dado o funcional 


Jil = f FUE) y (e)a) ae , (2.1.2) 


onde f: R$ — R é uma função conhecida, encontrar, dentre todas as curvas continuamente 
diferenciáveis y(x) que passam pelos pontos fixos (x1, y1) e (£2, Y2), aquela que minimiza 


(mais geralmente, extremiza) J. 


A fim de encontrar a curva que extremiza J, lançaremos mão de um artifício que reduz 
o problema ao de achar pontos extremos de uma função real de uma variável real. Seja 
y(x) a função procurada! que extremiza J e consideremos uma curva vizinha 7 definida 
por (Fig. 2.1.1) 


'Suporemos que tal função existe. A questão da existência de soluções para problemas variacionais é 
um problema matemático muito delicado (Courant & Hilbert 1953). 
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Figura 2.1.1: Variação de uma curva. 


(x) = y(x) + en(x) , (2.1.3) 


e] 


onde € é um parâmetro real arbitrário e (x) é uma função continuamente diferenciável 


que se anula em x = Tı € T = T9: 


n(zı) = n(z2)=0 . (2.1.4) 


Estas últimas condições são necessárias para que a curva variada y também passe pelos 
pontos extremos (21,41) e (x2,y>). Substituindo y por y em (2.1.2) o resultado é uma 


função de e: 


== f° FG(@),W@),2) de (2.1.5) 


Mas, uma vez que, por hipótese, a curva y(x) fornece um extremo (mínimo, máximo ou 
ponto estacionário) de J, a função P(e) deve passar por um extremo para € = 0, pois, neste 
caso, y torna-se idêntica a y. Portanto, uma condição necessária para que y(x) extremize 
J é 


= d® — fe (of oy | of Oy 
ia Ci [5 de" Oy! a dx , (2.1.6) 


decorrente da diferenciação de (2.1.5) sob o sinal de integral. Usando 


Oy OF 


Z=n =" (2.1.7) 
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Figura 2.1.2: Lema fundamental do cálculo das variações. 


a Eq.(2.1.6) escreve-se (pois Y = y para e = 0) 


dd n/0f Of, 
o a A E Si 2.1.8 
(a) gE (art ay) demo 218 


Esta última equação é verdadeira com n(x) arbitrária (exceto pela condição de anular-se 
nos limites de integração). A fim de extrair uma equação para y(x), é necessário explorar 
a arbitrariedade de 7. Mas para isto é preciso eliminar m de (2.1.8), o que pode ser 


facilmente conseguido graças a uma integração por partes: 


z2 Of , of |” z2 d ðf z2 d /Of 
a dy dy = En — A eA lte= = [ naz (5) 4 (2.1.9) 


onde usamos (2.1.4). Com a ajuda deste ultimo resultado, a Eq.(2.1.8) reduz-se a 


S E - (55) te A (2.1.10) 


Pode-se, agora, inferir uma equação diferencial para y(x) apelando-se para um resultado 


importante. 


Lema Fundamental do Cálculo das Variações. Se M(x), x, < x < x2, é uma 


x 


função contínua tal que fa; M (x)n(x)dx = 0 qualquer que seja a função contínua n(x) com 


n(x1) = n(x2) = 0, então M(x) = 0 em |z, £o]. 


Demonstração. Suponha M(£) > 0 para algum zı < E < x. Em virtude da 


continuidade de M, existe um subintervalo (£ — A, + A) no qual M(x) > c > 0. Escolha 


a função contínua m (Fig. 2.1.2) de tal modo que 7 = 1 no intervalo (€ — SE + 4), 
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m = 0 fora do intervalo (£ — A, + A) e n(x) > 0 para todo x € |x, £2]. A fim de dar à 


demonstração um caráter puramente analítico, eis aqui uma escolha possível para a função 


n: 


0 m<r<é-A 
(4/A*)(2-€+A)*lt+e2—-E+A/2? E-A<xer<e-A/2 
n(x) = 1 CHAM rs 6/2 
MA NEERA AFERRA AFANA 


0 E+A<2< 2 
Claramente, 
x2 EA E+A/2 
/ M(a)n(x)da = | M(ax)n(x)dx > | M(a2)n(x)da >cA>0 . 
x a 


Esta contradição mostra que M(£) não pode ser positivo, argumentos análogos aplicando- 


se na hipótese M(£) < 0. Como & é arbitrário, segue-se que M(x) = 0 em |x, x2] e a 


demonstração está completa. 


Este lema aplicado à Eq.(2.1.10) conduz à equação de Euler 
ane e e ee 2111 
dy dx a 


A equação diferencial de Euler é uma condição apenas necessária? para a existência de 
um extremo (máximo ou mínimo). Trata-se de uma equação diferencial de segunda ordem 
em cuja solução geral ocorrem duas constantes arbitrárias, o que normalmente permite 


satisfazer as condições de contorno de que a curva passe pelas extremidades fixas. 


E Exemplo 2.1.2 (Geodésicas da esfera). O comprimento de arco elementar em coordenadas 
esféricas é 
dé? = dr? + r2do? + r° sen?6 dy? . 


2Deduzida pela primeira vez por Leonhard Euler em 1744. 
3São conhecidas condições suficientes de aplicação relativamente simples, pelo menos no caso de extremo 
fraco (Elsgoltz 1969; Gelfand & Fomin 1963). 
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Numa superfície esférica de raio R centrada na origem tem-se r = R, de modo que a distância 
entre dois pontos ao longo de uma curva (0) sobre a superfície da esfera é dada por 


02 
ly] = R | y1 + sen26 p'(0)? do . 
01 


A curva geodésica é a que fornece a menor distância entre dois pontos, isto é, aquela que mini- 
miza ([p]. Conseqiientemente, (0) tem que satisfazer a equação de Euler com f(y, y’, 6) 
V1 + sen?0 y'()?: 


Of d/ Of, — aor of sen6 ip! o 
E lap VE Gola = oe [+ sento (oa = O» 


onde C1 é uma constante arbitrária. Resolvendo esta última equação para y’ resulta 


dip _ Cl Ci C1/ sen? 


dð sen 0,/ sen20 — C? E sen20,/1 — C? / sen?0 E va — C?) — C? cot? 0 ) 


Uma integração elementar fornece 


donde 
Ci 
Ccot9@=cos(p—Co) , C= ——. 
4/1 —C? 
Uma forma equivalente desta ultima equacao é 
cot 0 = Acosp+Bseny , A=CtcosCa , 


B = C7} seno . 


Para melhor compreender o que esta última equação representa, multipliquemo-la por R sen 9, 
obtendo como resultado 


Rcos6 = ARsen 0 cos y + BRsen 0 seng . 


Portanto, a curva geodésica é a interseção da superfície esférica r = R com o plano passando 
pela origem caracterizado pela equação 


z= Ax + By. 
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Figura 2.1.3: Superfície mínima de revolução 


Assim, as geodésicas da superfície esférica são arcos de grandes círculos, isto é, círculos cujos 


centros coincidem com o centro da esfera. E 


E Exemplo 2.1.3 (Superfície mínima de revolução). Considere uma superfície gerada pela 
rotação em torno do eixo y de uma curva plana passando por dois pontos fixos (Fig. 2.1.3) O 
problema consiste em encontrar a curva para a qual a área da superfície de revolução é mínima. 


A área de uma fita infinitesimal da superfície é dA = 2rzdl = 214 1/1 + y’? dx, de modo que a 
área total da superfície é 


22 
Aly] = an | aVvl+ydax . 
zı 


A equação de Euler deste problema com f(y, y', £) = x4/1 + y'? escreve-se 


1 
sana — Rc: A 


onde a é uma constante de integração arbitrária (obviamente menor que x1). Resolvendo esta 
última equação para y’ obtém-se 


d / Of 
oe) 


donde, por uma integração imediata, 


y= acosh™ (1) +b 


ou 
y— 

x = acosh —— . 
a 


A curva buscada é um arco de catenária. As constantes a e b devem ser determinadas exigindo 
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que a catenária passe pelos pontos extremos. Para certas posições dos pontos extremos podem 
existir duas catenárias distintas, apenas uma delas fornecendo o mínimo absoluto, ou o verdadeiro 
mínimo ser alcançado numa curva que não pertence à classe das catenárias e nem sequer possui 


derivada contínua (Weinstock 1952; Arfken 1985). E 


E Exemplo 2.1.4 (Braquistócrona). O problema inaugural e mais célebre do cálculo das 
variações é o da linha de deslizamento mais rápido, ou braquistócrona,* proposto como desafio aos 
matemáticos europeus, em 1696, por Johann Bernoulli e resolvido, muito antes do aparecimento 
da equação de Euler, por ele próprio e, independentemente, por |’Hopital, Jacok Bernoulli, 
Gottfried Wilhelm Leibnitz e Isaac Newton.” Este problema consiste em determinar a curva 
unindo dois pontos dados P e Q, não pertencentes a uma mesma reta vertical, que possua a 
propriedade de que, sob a ação da gravidade, uma partícula deslize (sem atrito) ao longo dela no 
menor tempo possível. Escolhamos a origem no ponto P e orientemos o eixo y verticalmente para 
baixo. Depois de cair uma altura y o módulo da velocidade da partícula é ds/dt = v = \/2gy. 


sando ds = + y'dz, o tempo gasto para deslizar da posição P= (0,0) até Q= (zg, yo) é 
Usando d 1 2d t t desli d ição P= (0,0) até Q ó 


P U 


r= [E-ga e Ee o, O0, en: 


A resolução deste problema é facilitada pela escolha de y como variável independente e da curva 
na forma z(y). Neste caso, com 2’ = dx /dy, 


e 


T|x] = A Gas dy 5. #0) = 0 , z(yo)= to. 


Para o problema assim formulado tem-se f(x, x’, y) = \/(1+2’”)/y e equação de Euler permite 
uma primeira integração imediata: 


aaa af x! 


===> = = G 3 
WEA 


onde ČC é uma constante arbitrária. Esta última equação integra-se mais facilmente introduzindo- 
se o parâmetro t através da equação x’ = tan t. Então 


tan? t 


C 
= = Dia Sl R 
y= ira VA Ue (1 — cos 2t) ; 


C 
dx = tan t dy = 2C; sen?t dt = C1 (1 — cos 2t) dt >> «= zA — sen2t) + C2 . 


4Do grego brachistos (brevíssimo) e chronos (tempo). 

5Na noite de 29 de janeiro de 1697, quando recebeu a carta-desafio, Newton não dormiu até resolver 
o problema, o que se deu por volta de quatro horas da manhã. Em seguida, a solução foi remetida 
anonimamente para Bernoulli. Ao ler a solução chegada da Inglaterra, Johann Bernoulli, segundo suas 
próprias palavras, reconheceu imediatamente o seu autor “como se reconhece o leão por sua pata”. 
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Tendo em conta que C2 = 0 porque y = 0 para x = 0, e fazendo 0 = 2t, resultam as equações 
paramétricas de uma família de ciclóides 


n= (0 — send) : y= (1 ~c0s6) ‘ 


a constante Cı sendo determinada pela condição de que a curva passe pelo ponto Q= (Zo, yo). 


Portanto, a braquistócrona é uma arco de ciclóide. E 


2.2 Notacao Variacional 


A variação de y, denotada por dy, é definida por dy = en, de modo que a Eq.(2.1.3) 
escreve-se 
y=ytoy . (2.2.1) 


Analogamente, a variação do funcional J é definida por 


(ds Poad 
s=) =f [5 su + Sty dr, (2.2.9) 


onde usamos (2.1.8) e 


öy! = en! = (en)! = (69) = Sy) - (2.2.3) 


Isto é análogo à notação do cálculo diferencial, onde a expressão e f'(x) = df com parâmetro 
arbitrário e é chamada de diferencial da função f(x). Uma integração por partes, com o 


uso de óy(x1) = óy(x>) = 0, reduz a Eq.(2.2.2) à forma 


ie i. ara (sf )| yar = be (2.2.4) 


Assim, uma condição necessária para um extremo de um funcional J[y] é que sua variação 
ôJ anule-se para dy arbitrária, exceto pela condição de anular-se nas extremidades do 
intervalo de integração. Em geral, as funções y(x) para as quais J = 0 são chamadas de 


extremantes ou curvas estacionárias. Esta terminologia se justifica porque J = 0 significa 
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apenas que uma variação dy da curva y deixa o funcional J[y] estacionário, não havendo 


qualquer garantia de que a curva forneça um máximo ou mínimo do funcional. 


2.3 Princípio de Hamilton e Equações de Lagrange 


A simples mudança de notação 


E 


_ aq 
dx E 


= >L ; ES 2.3.1 
4; fk: (2.3.1) 


e de le! od) 


mostra que a equação de Euler reduz-se à equação de Lagrange 


d /OL OL 
psd fes rene ener 2.3.2 
dt ( Oq ôq , 
a qual, portanto, decorre do princípio variacional 
t 
5S = öf “La 4,t) dt =0 (2.3.3) 
ti 


com óq(t1) = óg(ta) = 0. A generalização para sistemas com um número qualquer de graus 


de liberdade é imediata. Seja 


t2 
s=[ L(y + Gn Gis «<4 Guy t) ct (2.3.4) 


ti 


e considere as variações 


n(t) = a(t) + oat) , 
(2.3.5) 


Gn(t) = dn(t) + danlt) ; 


com os dq's independentes entre si e arbitrários, exceto pelas condições nos extremos 
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ôqk(tı) = ógulto) = 0, k =1,...,n. Destaque-se que é a mútua independência das coorde- 


nadas generalizadas que assegura que cada uma delas pode ser variada independentemente 


das demais. 


A variação da ação S é dada por 


t2 OL OL 
ôS = ——dqu + =— Og, | dt . 2.3.6 
t Bs E Odk in| l ) 


Uma integração por partes fornece 


— Did. 
qkr = dt Oq PED 


ia Pa | sG) 5 OL 
1 k 


k 


Levando em conta que as variações dos q's anulam-se nos pontos extremos, esta última 


equação reduz-se a 


t2 ƏL d,0L 
6S = dt — — — (= ) | dog, . 2.3.8 
ty 2, Z dt 5) k ( ) 
Impondo 6S = 0 somos conduzidos a 
t2 OL d,0L 
peed ee (ee = 0. 2.3. 
i E 2 E dt (55) a. 239) 


Uma vez que os ĝq’s são mutuamente independentes, podemos tomar todos iguais a zero 
exceto um particular dq,,. Neste caso, a soma em (2.3.9) reduz-se a um único termo 
correspondente a k = ko. Mas, como ôqk, é uma função arbitrária, o lema fundamental do 
cálculo das variações estabelece que o coeficiente de dq, em (2.3.9) é identicamente nulo. 
Finalmente, como o argumento anterior é aplicável a qualquer ko, conclui-se que (2.3.9) 


equivale a 


Dos B= Ta (2.3.10) 


d ðL ðL 
AA e 


Isto completa a dedução das equações de Lagrange a partir do principio variacional 6S = 0. 
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A ocasião é propícia para introduzir uma descrição geométrica deveras sugestiva da 
dinâmica lagrangiana. Como já vimos, o espaço cartesiano de n dimensões cujos pontos 
são as n-uplas (q1,...,Gn) é conhecido como espaço de configuração. O nome é bastante 
adequado, pois cada ponto do espaço de configuração corresponde a um conjunto de 
valores determinados de (q1,..., qn) que definem univocamente a configuração do sistema 
mecânico. À medida que o tempo passa, o estado do sistema se modifica e o ponto 
representativo do sistema descreve uma curva no espaço de configuração, já que as equações 
qı = n(t),...,qâm = Qn(t) são a representação paramétrica de uma curva tendo t como 
parâmetro. A expressão “movimento do sistema” refere-se a essa trajetória no espaço de 
configuração, que não tem em geral qualquer conexão com o espaço físico tridimensional, 
pois as coordenadas generalizadas não são necessariamente coordenadas de posição. Além 
disso, a trajetória do sistema no espaço de configuração não precisa ter qualquer seme- 
lhança com a curva descrita no espaço tridimensional por qualquer partícula constituinte 
do sistema. De agora em diante, salvo menção em contrário, designaremos simplesmente 
por q a n-upla (q1,...,qn), isto é, q = (q1,...,Gn). A evolução dinâmica corresponde a 
uma trajetória traçada no espaço de configuração e podemos enunciar o seguinte princípio 


fundamental. 


Princípio de Hamilton. Dado um sistema mecânico descrito pela lagrangiana 


L(q,q,t), seu movimento do instante tı ao instante ty é tal que a ação 


t2 
s=[ L(q, à,t) dt (2.3.11) 
tı 


é mínima (mais geralmente, estacionária) para a trajetória real, mantidos fixos os pontos 


inicial e final da trajetória no espaço de configuração. 


O princípio de Hamilton, que também costuma ser chamado de princípio da mínima 
ação tem como conseqüência importante que as mesmas equações de movimento são 
geradas por duas lagrangianas que só diferem pela derivada total em relação ao tempo de 


uma função arbitrária das coordenadas generalizadas e do tempo. 


Definição 2.3.1. Duas lagrangianas L(q,ġ, t) e L(q,q,t) são ditas equivalentes se elas 


diferem pela derivada total em relação ao tempo de uma função arbitrária das coordenadas 


Uma discussão encantadora e envolvente do princípio da mínima ação encontra-se em Feynman, 
Leighton & Sands (1963), volume II, capítulo 19. 
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Figura 2.3.1: Péndulo plano com ponto de suspensão móvel. 


generalizadas e do tempo f(q, t): 


Lg, 8) = Lait) + Silat) - (2.3.12) 


Teorema 2.3.1. Lagrangianas equivalentes dao lugar às mesmas equações de movi- 


mento. 


Demonstração. A ação S associada a L é dada por 


= t2 _ t2 t2 d 
g= | L(g,q,t) a= f Laita f T t= S4 Falta). to) — Fa) +) , 


Mas, como a variação da ação mantém os extremos q(t1) e q(t2) fixos, a condição 56S = 0 


é idêntica a 6S = 0, demonstrando que L e L produzem exatamente as mesmas equações 


de movimento. o 


E Exercício 2.3.1. Demonstre por substituição direta nas equações de Lagrange que la- 


grangianas equivalentes geram as mesmas equações de movimento. E 


E Exemplo 2.3.1. Discutir a lagrangiana para um pêndulo plano cujo ponto de suspensão 
desloca-se sobre uma reta horizontal com velocidade constante. 


Solução. Usando as coordenadas indicadas na Fig. 2.3.1, temos 
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T= = (+ tôcos 9)2 + (—6 sen 0)? ] ; 


donde 


L= (2? + C0? + 2636 cos 0) +mgtcos 0 . 


Se =v = constante podemos escrever 


flee dm 
ey md + mgtoos 04 (Su t+ mlusen 8) ; 


Descartando a derivada total, a lagrangiana resultante coincide com a que seria obtida por um 
observador em relação ao qual o ponto de suspensão do pêndulo é fixo. Você é capaz de explicar 


por quê? El 


É possível demonstrar (Problema 2.2) que duas lagrangianas só produzem exatamente 
as mesmas equações de movimento se diferem pela derivada total em relação ao tempo de 
uma função das coordenadas generalizadas e do tempo. No entanto, há lagrangianas que 
não diferem por uma derivada total mas geram equações de movimento equivalentes, isto 


é, que não são idênticas mas possuem as mesmas soluções. 


E Exercício 2.3.1. Mostre que a lagrangiana 


gera uma equação de movimento equivalente à de um oscilador harmônico de massa m = 1, mas 


não difere meramente por uma derivada total da lagrangiana usual L = &2/2 —w?2?/2. E 


2.4 Princípio de Hamilton no Caso Não-Holônomo 


Na seção anterior admitimos que o sistema mecânico era descrito por coordenadas 
independentes entre si, e tal independência é crucial para permitir a dedução de (2.3.10) 
a partir de (2.3.9). Tais coordenadas generalizadas mutuamente independentes sempre 


existem quando todos os vínculos a que o sistema está sujeito são holônomos. Quando há 
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vínculos não-holônomos presentes, é em geral impossível introduzir coordenadas generali- 
zadas de tal modo que as equações de vínculo sejam identicamente satisfeitas. E possível, 
ainda assim, deduzir as equações de movimento a partir do princípio de Hamilton no caso 


especial em que os vínculos não-holônomos são equações diferenciais da forma 


5 ando; + aundt =0 , L=1,..., p, (2.4.1) 
k=1 
cujos coeficientes aj € au são funções somente de q1,...,Gn, € t. Suponhamos, portanto, 
que o sistema seja descrito por n coordenadas (q1, . - - , qn) e esteja submetido aos p vínculos 


diferenciais independentes (2.4.1), o índice l servindo para distinguir as equações de vínculo 
umas das outras. Apesar da forma aparentemente restrita, os vínculos do tipo (2.4.1) 


abrangem quase todos os casos de vínculos não-holônomos de interesse físico. 


Seja L a lagrangiana do sistema incluindo somente o potencial generalizado das forças 
aplicadas, isto é, as forças de vínculo responsáveis pela validade das Eqs. (2.4.1) não estão 


incluídas na lagrangiana. O princípio de Hamilton 6S = 0 implica 


ta OL d,0L 


mas, agora, não podemos inferir que o coeficiente da cada dq, é zero porque os dq’s não 
são independentes. Com efeito, as Eqs.(2.3.5) mostram que cada dq, é um deslocamento 
virtual, pois o tempo permanece fixo quando se executa a variação que leva q(t) em 


qult) + q(t). Mas, conforme as Egs.(2.4.1), os deslocamentos virtuais devem obedecer a 


a AiO Dk =0 5 l= 1, “sp (2.4.3) 


k=1 


para que haja compatibilidade com os vínculos (usamos dt = 0 para deslocamentos vir- 
tuais). As n variações óg1,...,ôqn têm que satisfazer as p equações (2.4.3), de modo que 
apenas (n — p) variações dos q's são independentes entre si. Trata-se, portanto, da deter- 
minação de um extremo condicionado para o funcional S, e o tratamento segue a linha do 


método dos multiplicadores de Lagrange do cálculo diferencial. 


A equação 


n 


J >> OD an54x) = A dt X` 3 Aran) Os = 0 (2.4.4) 
1 k=1 1 


l=1 k=l l=1 
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é uma consequência óbvia de (2.4.3) para valores arbitrários dos multiplicadores de La- 
grange àı(q, q, t), ---, An(q,G,t). Adicionando (2.4.2) a (2.4.4) resulta 


te OL d,0L p 
i dt DD Emi al 7 ) t 5 Nau bia =0 a (2.4.5) 


Oq =i 


Como os dq’s nao são independentes, nada podemos afirmar a respeito do coeficiente de 
cada dq; nesta última equação. Com uma numeração adequada das variáveis, podemos 
escolher as (n — p) primeiras variações óq1,...,0Gn-p Como mutuamente independentes, as 
p últimas variações sendo determinadas em termos das (n — p) primeiras pela resolução das 
p equações (2.4.3). Por outro lado, temos p multiplicadores de Lagrange à nossa disposição 
e podemos escolhê-los de tal modo que os coeficientes dos p últimos dq’s em (2.4.5) sejam 


nulos, isto é, 


ðL d a 
Aak O , k=n-p+l1,... n. 2.4.6 
da - (52) 2 llk p ( ) 


Com os À's determinados pelas equações (2.4.6), a Eq. (2.4.5) reduz-se a 


P 


oa Od l=1 


que só envolve os (n — p) primeiros dq’s independentes entre si, implicando 


OL d 
= E sia s 2.4. 
qk -E 3 SORE pah PR ea) 


Em síntese, as Eqs.(2.4.6) e (2.4.8) mostram que as equações de movimento do sistema 


são 


d/0L É 
dt (5) - 5 A z 1Qlk , = 1, EEE (2.4.9) 


Mas isto é insuficiente, pois agora temos apenas n equações para (n+p) incógnitas, a saber, 
as n coordenadas q; e os p multiplicadores de Lagrange A;. As p equações adicionais são, 


evidentemente, as equações de vínculo (2.4.1), que podem ser escritas na forma equivalente 
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X Gude +4 =0 , L=1,...,p. (2.4.10) 
k=1 


As equações (2.4.9) e (2.4.10) constituem um conjunto de (n + p) equações para (n + p) 


incógnitas, e permitem a determinação unívoca do movimento do sistema. 


Resta investigar o significado físico dos multiplicadores de Lagrange, que também 
são determinados no processo de resolução das equações de movimento. Imaginemos os 
vínculos removidos e forças generalizadas Qj, atuando sem provocar nenhuma alteração 
no movimento do sistema. Ora, isto só ocorreria se Qj, fossem as forças de vínculo, pois 
somente assim o sistema obedeceria às restrições (2.4.10). Mas, levando em conta que L só 
inclui as forças aplicadas, as forças adicionais Qj, apareceriam nas equações de movimento 


na forma (1.8.13), isto é, 


=Q. (2.4.11) 


d ðL OL 
dt EA “Oy 


Para que os movimentos sejam idênticos, as equações de movimento (2.4.9) e (2.4.11) 


precisam ser idênticas. Em outras palavras, 


P 


l=1 


é a k-ésima força generalizada de vínculo. Assim, além do movimento do sistema, na 
presente formulação as forças de vínculo aparecem como parte da resposta. E preciso não 
esquecer que as forças generalizadas de vínculo estão relacionadas com as forças de vínculo 


propriamente ditas por intermédio de (1.5.6). 


A conclusão da análise acima é que, desde que adequadamente modificadas, as equações 
de Lagrange são válidas mesmo na presença de vínculos não-holônomos. Além do movi- 
mento do sistema mecânico, as forças de vínculo são determinadas como importante sub- 


produto do formalismo dos multiplicadores de Lagrange.” 


E Exercício 2.4.1. Prove que o trabalho virtual das forças generalizadas de vínculo (2.4.12) 
é zero. Isto mostra que mesmo no caso de vínculos não-holônomos o princípio de Hamilton está 


em harmonia com o princípio de d' Alembert. E 


TÉ possível formular as equações de movimento para sistemas não-holônomos sem lançar mão de multi- 
plicadores de Lagrange. Trata-se de um método baseado na introdução das chamadas quase-coordenadas 
e que culmina nas equações de Gibbs-Appell (Pars 1965; Gantmacher 1970; Desloge 1982). 
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Comentário. No caso mais geral em que as equações de vínculo são da forma 


ata ds L=1,...,Pp , (2.4.13) 


o resultado considerado correto (Rund 1966; Saletan & Cromer 1970) para as equações de 
movimento é 


p 


d/OL OL Og 
= — =) eae : 2.4.14 
BO) Op og, a men 


É claro que estas equações reduzem-se a (2.4.9) quando as equações de vínculo envolvem as 


velocidades linearmente. 


E Exemplo 2.4.1. Como primeira ilustração puramente acadêmica, considere uma partícula 
movendo-se livremente num plano exceto pelo vínculo não-holônomo 


t—-wy=0, (2.4.15) 


onde w é uma constante. Empregando a notação q1 = x e q2 = y, vemos que (2.4.15) é da forma 
(2.4.10) com aq = 1, aig = 0, ay = —wy. Como há apenas um vínculo, | toma somente o valor 
l = 1. Usando-se a lagrangiana 


L= ~(# +9) (2.4.16) 
as Eqs.(2.4.9) adquirem a forma 
më = àa = à) , my=Aag=0. (2.4.17) 
A solução geral da segunda das Eqs.(2.4.17) é 
y=yotuet , (2.4.18) 
com yo € vo constantes arbitrárias. Levando (2.4.18) em (2.4.15) e integrando, obtém-se 


1 
£ = To + wyo t + zv v0 Pa (2.4.19) 


com xo constante arbitrária. A solução geral para o movimento do sistema está contida em 
(2.4.18) e (2.4.19). Finalmente, o multiplicador de Lagrange é determinado por 
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À = MË = Mwy = MWY , 


resultando 

Q =Q, =F; =Mħan=M=mwġ , F=Ma=0 (2.4.20) 
para as componentes cartesianas da força de vínculo. E 
E Exercício 2.4.2. Prove que o vínculo (2.4.15) não é holônomo. E 


E Exercício 2.4.3. Resolva as equações newtonianas de movimento para uma partícula 
numa plano sujeita à força F’ com as componentes (2.4.20). A solução geral obtida satisfaz 
automaticamente o vínculo (2.4.15)? Sugestão: o que deve acontecer com as condições iniciais 


para que os vínculos sejam respeitados durante todo o movimento do sistema? a 


Advertência. Vinculos nao-holonomos não podem ser substituídos na lagrangiana 
para eliminar variáveis. Por exemplo, se a variável x for eliminada da lagrangiana (2.4.16) 
por meio de (2.4.15), a nova lagrangiana assim obtida conduzirá a uma equação de movi- 
mento para y cuja solução é completamente diferente de (2.4.18), que é a solução correta 


(verifique você mesmo). 


E Exemplo 2.4.2 (Patinete em movimento num plano horizontal). Como modelo supersim- 
plificado de patinete, tomemos uma haste rígida, delgada, homogênea de comprimento £ restrita 
a mover-se de tal modo que a velocidade do centro de massa é sempre paralela à haste (Fig. 
2.4.1). Como coordenadas utilizaremos o vetor posição do centro de massa r = ri+ yj e o ângulo 
9 que a haste faz com o eixo x. Sendo €g = cos i+ sen 0j o vetor unitário ao longo da haste, o 
vínculo exprime-se pela equação r x & = 0 ou, em componentes, 


tsen — ycos0=0. (2.4.21) 


Utilizando a notação q = £, q2 = y, q3 = 0, identificamos ay = senô, ajg = — cos 0, a13 = 
aıt = O por simples comparação entre (2.4.21) e (2.4.10). Dado que V = 0, a lagrangiana é 
simplesmente a soma da energia cinética do centro de massa com a energia de rotação da haste 
em torno do centro de massa: 
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Figura 2.4.1: Patinete num plano horizontal. 


Pes 
ie Ta +9) +58, (2.4.22) 


onde J é o momento de inércia da haste relativamente a um eixo perpendicular a ela passando 
pelo centro de massa. As equações de movimento são 


mi=Msen6 , mij=-Acos6 , IÖ=0. (2.4.23) 
A equação para 6 tem por solução 


9=% +t, (2.4.24) 


com ĝo e Q constantes arbitrárias. Combinando as duas primeiras equações de movimento 
deduzimos 


tcos0+iysend =0. (2.4.25) 


Da equação de vínculo (2.4.21) decorre 


j=itand => j=itand+Niseco . (2.4.26) 


Introduzindo este resultado em (2.4.25) resulta 


—— tpi UU 
cos 0 cos? 0 dt 


x . send d x f ; 
Q 0 (559) =0 = t = C cos(Qt + 0o) . (2.4.27) 


Uma nova integração fornece 
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x= zo + Csen(Qt+ 4) , (2.4.28) 


onde xo e C (= C’/Q) são constantes arbitrárias. A inserção de (2.4.24) e (2.4.28) na primeira 
das Eqs.(2.4.26), seguida de uma integração, redunda em 


y = yo — Ccos(Qt + A) . (2.4.29) 


O patinete gira em torno de seu proprio centro de massa com velocidade angular constante 2, 
ao mesmo tempo que o centro da massa descreve uma circunferéncia no plano do movimento 
com a mesma velocidade angular Q = 0. Se Q = 0, o patinete executa um movimento retilíneo 


uniforme. = 


Embora as equações da forma (2.4.1) não incluam os tipos mais gerais de vínculos 
não-holônomos, elas dão conta de vínculos holônomos. Com efeito, vínculos holônomos 


são da forma 


fila, t) = 0 , l=1,...,p , (2.4.30) 


Qk = AT 5 alt = E. (2.4.32) 


Assim, o método dos multiplicadores de Lagrange pode ser aplicado a sistemas holônomos 
quando é inconveniente substituir os q's por um conjunto menor de variáveis independentes 
ou quando se deseja obter as forças de vínculo. A guisa de ilustração, apliquemos o 


formalismo dos multiplicadores de Lagrange a um caso holônomo. 


E Exemplo 2.4.3 (Cilindro rolando sem deslizar sobre outro cilindro fixo). Usaremos como 
coordenadas os ângulos 0 e ¢ representados na Fig. 2.4.2, onde ¢ é o ângulo de rotação do cilindro 
móvel em torno do seu eixo de simetria e r é a distância entre os eixos dos cilindros. Note que 
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Figura 2.4.2: Cilindro rolando sem deslizar sobre cilindro fixo. 


r e 0 são coordenadas polares do centro de massa do cilindro móvel relativamente ao centro de 
massa do cilindro fixo. A energia cinética do cilindro móvel compõe-se da energia cinética do 
centro de massa mais a energia de rotação em torno do centro de massa, isto é, 


: les; 
pe Us +) + 510? , (2.4.33) 
onde I = ma?/2 é o momento de inércia do cilindro em torno do seu eixo de simetria. Neste 


problema há dois vínculos holônomos, a saber: 


rô= ad (vínculo de rolar sem deslizar) ; (2.4.34) 


r=a+b (vínculo de contato) . (2.4.35) 


O vínculo de rolar sem deslizar exprime a exigência de que o ponto O” desloque-se com veloci- 
dade vp = rÊ igual àquela gerada por sua rotação com velocidade angular ¢ em torno do eixo 
instantâneo de rotação que passa pelo ponto de contato entre os cilindros. Em forma diferencial 
o vínculo de contato escreve-se 


r=0. (2.4.36) 


Introduzindo a notação q = r, q2 = 9, q3 = 9, identificamos 


a = 0 > Q2 ZT , a3=-a , agi = 1 , a22 = 093 = 0 , (2.4.37) 


onde | = 1 corresponde ao vínculo (2.4.34) e | = 2 ao vínculo (2.4.36). Com o uso da La- 
grangiana 
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. 2 . 
L= (ie +7267) + Tg — mgr cosô , (2.4.38) 


as equações de movimento assumem a forma 


mi — mr6? + mgcos@ = A,a11 + Aga21 = A2 , (2.4.39) 
d,a; 
mgl 0) — mgr sen 0 = Ayjayo + À2022 = rÀ , (2.4.40) 
maz .. 
-z ? = A1013 + À2a23 = —aAr . (2.4.41) 


Com o emprego das equações de vínculo, as equações de movimento reduzem-se a 


—m(a + b)6? + mgcos6 = do , (2.4.42) 
m(a + b)?6 — mg(a + b)senO = (a +b)M , (2.4.43) 
ta SHES 4-2 (2.4.44) 


Combinando as duas últimas equações de modo a eliminar A, obtém-se 


(a + b)6—gsend=0. (2.4.45) 


A força de reação normal do cilindro fixo sobre o móvel é a componente radial da força de vínculo 
sobre o cilindro móvel, isto é, 


2 
N = Q, = Q1 =X Man = A = mgcos 6 — m(a + b)6” . (2.4.46) 
I=1 


É possível, agora, responder à seguinte pergunta: em que ponto o cilindro móvel se desprende do 
cilindro fixo? Naturalmente, isto se dá no instante em que N = 0. Suponhamos que o cilindro 
comece a cair a partir do repouso (Ê = 0) da posição vertical (0 = 0). Como não há atrito de 
deslizamento, a energia mecânica se conserva: 


2 
3 
T+V= a + 7767) + ne + mgr cos 6 = gina + b)?6? + mg(a+ b) cos = E , (2.4.47) 
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onde foram usados os vínculos. Uma vez que no instante inicial E = mg(a + 6), deduzimos 


“(a + b)6? = g(1—cos@) . (2.4.48) 


Em decorréncia deste ultimo resultado, ficamos com 
N = (7 cos0 — 4). (2.4.49) 


O cilindro móvel abandona o cilindro fixo no ângulo 0, = cos !(4/7), ou seja, 0 = 55°09’, 
resultado independente dos raios dos cilindros. A partir do contato desfeito, os vínculos deixam 
de existir e o cilindro móvel torna-se um sistema com três graus de liberdade, com as coordenadas 


r,0, 4 independentes entre si. E 


No caso holônomo a técnica dos multiplicadores de Lagrange é dispensável em princípio, 
já que é possível escolher coordenadas generalizadas em termos das quais as equações de 
vínculo são identicamente satisfeitas e as forças de vínculo podem ser obtidas pelo proced- 
imento descrito na Seção 1.7. No entanto, na discussão de certas questões teóricas gerais 
é frequentemente vantajoso tratar vínculos holônomos pela técnica dos multiplicadores de 


Lagrange. Dados os vínculos holônomos (2.4.30), considere a nova lagrangiana £ definida 


por 
p 
I=1 
Introduzindo as (n + p) variáveis &,...,én+p definidas por 
é = qi,- Kan = qn, Sad T A, tae Cap = Ap ; (2.4.51) 


e tratando-as como (n + p) coordenadas generalizadas independentes, as equações de 


movimento e as equações de vínculo podem ser escritas na forma unificada 


dvds BE 
no OE q 


SA análise acima não é plenamente realista porque a força de vínculo tangencial tornar-se-á exces- 
sivamente pequena para impedir o deslizamento antes de ser atingido o ponto em que N = 0 (Symon 
1971). 


k=1,... n+p. (2.4.52) 
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E Exercício 2.4.3. Prove que as n primeiras equações (2.4.52) são idênticas às equações 
(2.4.10) com os ay dados por (2.4.32), ao passo que as p últimas equações (2.4.52) reproduzem 


as equações de vínculo (2.4.30). E 


As Egs.(2.4.50) e (2.4.52) mostram que o princípio variacional correto para se formular 
as equações de movimento de um sistema descrito pela lagrangiana L(q,q,t) e sujeito aos 


vínculos holônomos (2.4.30) é 


5/4 AC te > A filat) }dt=0 , (2.3.53) 
+ l=1 


onde as coordenadas generalizadas e os multiplicadores de Lagrange são variados indepen- 


dentemente. 


2.5 Propriedades de Simetria e Leis de Conservação 


Uma constante de movimento ou integral primeira de um sistema mecânico é uma 
função f das coordenadas e velocidades generalizadas, e possivelmente do tempo, que 


permanece constante durante o movimento do sistema: 


F(gr,...,Gn,G1,---,Gn,t) = constante . (2.5.1) 


As constantes de movimento produzem equações diferenciais de primeira ordem que dão 
importantes informações a respeito da evolução temporal do sistema. Freqüentemente, em- 
bora não se conheça a solução exata das equações de movimento, o conhecimento de certas 
integrais primeiras permite extrair muitas informações fisicamente significativas quanto à 
natureza do movimento do sistema. É possível, às vezes, obter respostas exatas para certas 
perguntas graças às constantes de movimento sem a necessidade da resolução completa 
do problema dinâmico. Conseqüentemente, investigar condições gerais que assegurem a 
existência de constantes de movimento é de alta relevância. O primeiro e mais simples 


resultado dessa investigação será enunciado após duas definições convenientes. 


Definição 2.5.1. Seja L(q, q, t) a lagrangiana de um sistema com n graus de liberdade. 


A quantidade pą definida por 
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OL 


a E 23522 
Pk Od. ( 5 ) 


é chamada de momento conjugado (ou momento canônico conjugado) à coordenada qp. 


E Exemplo 2.5.1. Seja L = (m/2(iº +92 +22) — V(x,y,2). Neste caso, pp = mi é a 


componente x do momento linear da partícula, com resultados análogos para py e pz. E 


m Exemplo 2.5.2. Seja L = (m/2)r2 — ed(r,t) + (e/c)r- A(r,t) a lagrangiana de uma 
partícula de carga e num campo eletromagnético externo. Então py = mi + (e/c) Ax(x,t), que 
não coincide com a componente x do momento linear da partícula devido ao termo adicional 


e/c) Ar. Resultados análogos valem para as componentes py e pz. E 
y 


Definição 2.5.2. Se a lagrangiana de um sistema não contém uma determinada coor- 


denada q (embora contenha q), então a referida coordenada é dita cíclica? ou ignorável. 


Teorema 2.5.1. O momento conjugado a uma coordenada cíclica é constante de 


movimento. 


Demonstração. Seja q, uma coordenada cíclica de L. A k-ésima equação de Lagrange 


d,OL OL 
(EE) Eno 
dt \Odx Oqu: 
reduz-se a 
dpk 
che So 
dt 
em virtude de (2.5.2) e porque 0L/0q, = O para uma coordenada cíclica. Portanto, 


py, =constante. 


E Exemplo 2.5.3. Em coordenadas esféricas, a lagrangiana de uma partícula sujeita a uma 
força central escreve-se 


“Em problemas de grande importância física as coordenadas que não aparecem na lagrangiana costu- 
mam ser ângulos, daí chamar-se tais coordenadas genericamente de cíclicas. 
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L= sr? + 776? + r? sen76 PP) — V(r) . (2.5.3) 


Claramente y é coordenada cíclica, donde 


OL 
Po = 2 = mr? sen20 ġ = constante . (2.5.4) 


É fácil verificar que py é a componente z do momento angular da partícula. E 


E Exemplo 2.5.4. Considere um pêndulo cujo ponto de suspensão pode deslizar horizontal- 
mente sem atrito. Como vimos no Exemplo 2.3.1, a lagrangiana do sistema é 


L= olé? + 076? + 2440 cos 0) + mglcos6 . 


Uma vez que x é coordenada cíclica, temos 
Pr = ~~ = Mi + mlo cos 0 = constante . 
Ox 
Claramente, py é a componente x do momento linear da partícula oscilante de massa m. E 


A ausência de uma certa coordenada pode ser interpretada como uma propriedade 
de simetria da lagrangiana. De fato, se q, é coordenada cíclica uma alteração no valor 
de q; não modifica a lagrangiana. Em outras palavras, a lagrangiana é invariante sob 
o deslocamento de uma coordenada cíclica. Mas um deslocamento de uma coordenada 
cíclica de posição corresponde a uma translação, ao passo que o deslocamento de uma 
coordenada cíclica angular corresponde a uma rotação. No exemplo anterior, a conservação 
da componente x do momento linear é consequência da invariância da lagrangiana frente a 
translações ao longo da direção x. Correspondentemente, no Exemplo (2.5.3) a conservação 
da componente z do momento angular decorre da invariância da lagrangiana sob rotações 
em torno do eixo z. Estas observações sugerem a existência de uma conexão geral entre 
simetrias da lagrangiana sob translações e rotações e as leis de conservação do momento 


linear e do momento angular. 


Considere a transformação infinitesimal 


r; > r; =r; + ôr; , (2.5.5a) 
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Figura 2.5.1: Rotação rígida de um sistema de partículas 


vi > v; = V; + ÔV; , (2.5.50) 


onde dr; e dv; são deslocamentos infinitesimais das posições e velocidades de um sistema 


de n particulas. Seja 


L(r1,..., rN, t1,- EN, t) = Lr, v,t) (2.5.6) 


a lagrangiana do sistema. A variação de L sob a transformação (2.5.5) é definida por 


S dvi] , (2.5.7) 


onde usamos a notação 


OL = ƏL, ôL, OL 


= f f 2.5. 


com definição análoga para OL /ôOv;. 


E Exemplo 2.5.5. Uma translação rígida do sistema de partículas consiste num mesmo 
deslocamento € = en de todas as partículas do sistema de tal modo que as posições relativas das 
partículas permaneçam inalteradas, bem como suas velocidades. Neste caso, as Eqs.(2.5.5) são 
válidas com 
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dr; = en ; 6v;=0 , (translações) (2.5.9) 


onde e é um parâmetro infinitesimal. E 


E Exemplo 2.5.6. Uma rotação rígida do sistema de partículas consiste numa rotação de 
todos os vetores do sistema de um mesmo ângulo 960 em torno de um eixo definido pelo vetor 
unitário à. Inspecionando a Fig. 2.5.1 conclui-se que |ér;| = r; sena 60, que tem a aparência de 
módulo de um produto vetorial. De fato, definindo o vetor 60 = 90h resulta imediatamente que 
a a expressão correta para o vetor ôr; é dr; = 00 x r;. Já que cada velocidade ôv; sofre a mesma 
rotação, as Eqs.(2.5.5) são válidas com 


ôr; = ôb x ri : ôv; = ðb x Vi , (rotações) (2.5.10) 


sendo 90 o parâmetro infinitesimal associado à transformação. E 


A fim de formular os resultados numa forma suficientemente geral, suporemos que o 


sistema descrito pela lagrangiana (2.5.6) está sujeito aos p vínculos holônomos 
To ea ENO. y BE) tado (2.5.11) 


Teorema 2.5.2. Suponha que um sistema mecânico seja descrito pela lagrangiana 
L = T — V, onde V é um potencial independente das velocidades. Se a lagrangiana e 
os vínculos (2.5.11) são invariantes sob uma translação rígida arbitária, então o momento 


linear total do sistema é conservado. 
Demonstração. Conforme a discussão ao final da Seção 2.4, a lagrangiana 
Pp 
L=L(r,v,t)+ >> Acfs(r,t) (2.5.12) 
s=1 


fornece de um só golpe as equações de movimento e as equações de vínculo. Uma vez que 
L e as equações de vínculo são invariantes sob translações arbitrárias, £ também o é. Em 


particular, £ é invariante sob qualquer translação infinitesimal, donde 


78 CAPÍTULO 2. PRINCÍPIO VARIACIONAL DE HAMILTON 


LOL 3. g 
0=ôL= 2 a (en) = eù - x BE (2.5.13) 


onde usamos (2.5.7) e (2.5.9). Como e é arbitrário, deduzimos 


N ƏL 
n- =0. 2.5.14 
n » dE 0 (2.5.14) 
Mas, notando que 
OL OL OL : 


onde p; é o momento linear da 7-ésima partícula, as equações de Lagrange podem ser 


escritas na forma 


ðL ef OL dp; 
Assim, a Eq.(2.5.14) torna-se 
dice dy, 
A ‘Spi = 7 (a-P) =0 , (2.5.17) 


provando que a componente do momento linear total P ao longo da direção ñ é conser- 


vada. Escolhendo sucessivamente n = i,j,k, conclui-se que P,, Py e P; são constantes de 


movimento, isto é, o vetor momento linear total é conservado. 


Teorema 2.5.3. Seja V um potencial independente das velocidades. Se a lagrangiana 
L=T — V e os vínculos (2.5.11) são invariantes sob uma rotação rígida arbitrária, então 


o momento angular total do sistema é conservado. 


Demonstração. A invariância de £ sob qualquer rotação infinitesimal implica 


N 
0=52=5) EE (00x 09) + E 


i=1 Ov; 


(50x v;)| , (2.5.18) 
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onde usamos (2.5.7) e (2.5.10). O produto misto é invariante sob uma permutagao ciclica 


dos vetores envolvidos, o que permite escrever 


00n-> rx +vix5—| =0. (2.5.19) 


Tendo em conta (2.5.15), as equações de Lagrange (2.5.16) e a arbitrariedade de 60, somos 


conduzidos a 


2 d A d 
) i=1 


1= 


H 


Portanto, a componente do momento angular total L ao longo da direção ñ é constante 
de movimento. A arbitrariedade de n implica a conservação do vetor momento angular 
total. o 


Os dois últimos resultados aplicam-se a sistemas de partículas isolados e, também, a sis- 
temas de corpos rígidos isolados porque, neste caso, os vínculos de rigidez — distâncias fixas 
entre todos os pares de pontos — são obviamente preservados por rotações ou translações. 
É importante sublinhar, ainda, que um dado sistema pode ser dotado de simetria parcial 
sob rotações ou translações, o que acarreta a conservação de algumas das componentes de 
P ou L, mas não de todas. Considere, por exemplo, uma partícula movendo-se no poten- 
cial gravitacional de um plano homogêneo infinito. O potencial é claramente invariante 
sob translações paralelas ao plano e sob rotações em torno de um eixo perpendicular ao 
plano (que tomaremos como eixo z). Em virtude da invariância da energia cinética da 
partícula sob quaisquer translações ou rotações, a lagrangiana é invariante sob translações 
ao longo das direções x e y, e sob rotações em torno do eixo z. Conseqüentemente, Py, Py 


e L, são quantidades conservadas. 


Incidentalmente, as Eqs.(2.5.17) e (2.5.20) mostram que, para um sistema isolado, 
portanto invariante sob translações e rotações, a soma das forças internas e dos torques 
internos é zero. É notável que a simetria sob translações e rotações garante a conservação 
do momento linear total e do momento angular total, sem a necessidade de se invocar a 


terceira lei de Newton nem sequer em sua forma fraca. 
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2.6 Conservação da Energia 


Naturalmente, é de se esperar que a dinâmica lagrangiana contenha o teorema da con- 
servação da energia para sistemas cujas forças derivam de um potencial dependente apenas 
das posições das partículas. Na verdade, é possível demonstrar um teorema de conservação 
bastante geral que se reduz à lei da conservação da energia num caso especial. Embora 
tenha sido vantajoso o emprego de coordenadas cartesianas para lidar com translações e 
rotações, aqui será mais conveniente considerar o sistema descrito por coordenadas gen- 
eralizadas q1,...,Ghn e pela lagrangiana L(q,q,t). Suporemos que o sistema é holônomo, 
de modo que as coordenadas generalizadas são efetivamente independentes entre si. A 


generalização para o caso não-holônomo é deixada como um exercício. 


Teorema 2.6.1. Sejam q1,...,qn coordenadas generalizadas de um sistema com la- 


grangiana L. Se L não depende explicitamente do tempo, a quantidade h definida port? 


h=5 qa -L (2.6.1) 


é uma constante de movimento, frequentemente chamada de integral de Jacobi. 


Demonstração. A derivada total de h em relação ao tempo é 


JS „OL nA o Bic | Soa OL 
dt Dto Catho Dog Oq GES? 


k=1 =1 


donde, usando as equacoes de Lagrange, 


a (2.6.2) 


Se L não depende explicitamente do tempo, L/ðt = 0 e a Eq. (2.6.22) estabelece que h é 


constante de movimento. 


Sob circunstâncias bem definidas, que passamos a examinar, h é a energia total do sis- 


tema. A energia cinética, expressa em termos das coordenadas e velocidades generalizadas, 


10 Às vezes h é chamada de “função energia” (“energy function”, em inglês). 


2.6. CONSERVAÇÃO DA ENERGIA 


escreve-se 


= 1 oe 1 i Or; a Or; . Or; Or; 
Cl So = som (So a =) bs da! + =) 


i 


tendo sido usada a Eq.(1.5.4). Esta última equação pode ser reescrita na forma 


é 1 ne 
T=M+> Mids + 3 > Madd o 
k k,l 
onde Mo, M, e Mp são funções dos q's e do tempo dadas por 


1 Or; Or; 
Mo = 5 dG o 


Or; Or; 
Mas Be Bt da 
Or; Or; 


dq q 
E Exercício 2.6.1. Deduza as Eqs.(2.6.5). 


Se L= T — V, com V independente das velocidades, tem-se 


OT . 
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(2.6.3) 


(2.6.4) 


(2.6.6) 


Se, além disso, as Eqs.(1.5.2) que definem as coordenadas generalizadas não envolvem 


explicitamente o tempo, Or;/Ot = 0 de modo que My = Mp = 0 e (2.6.4) nos diz que T 


é uma função homogênea do segundo grau das velocidades generalizadas. Portanto, pelo 


teorema de Euler das funções homogêneas (Apêndice B), 


p=op=evie Teve 


(2.6.7) 


e h é a energia total do sistema. Nas presentes circunstâncias, se V não é função explícita do 


tempo L tampouco o é, de modo que a energia total — no caso, igual a h — será conservada. 
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Vale notar que, mesmo na auséncia de potenciais com dependéncia temporal explicita, 
a existéncia de vinculos dependentes do tempo (como no Exemplo 1.5.2) introduz uma 
dependência temporal explícita nas equações (1.5.2), fazendo com que h não coincida com 
a energia total. Cumpre destacar, ainda, que as condições que asseguram a conservação 
de h são completamente independentes daquelas que garantem a igualdade entre he a 
energia total. Assim, h pode ser conservada sem ser a energia total, ou ser a energia total 
sem ser conservada. Por outro lado, ao contrário da lagrangiana, cujo valor independe 
da escolha das coordenadas generalizadas, o valor e a forma funcional de h dependem do 


particular conjunto de coordenadas generalizadas que se tenha escolhido. 


De modo geral, quando há vínculos que dependem explicitamente do tempo a energia 
total não se conserva, e a razão é simples. Como vimos na Seção 1.3, se os vínculos mudam 
com o tempo, as forças de vínculo realizam trabalho por ocasião de deslocamentos reais, 
embora o trabalho realizado durante deslocamentos virtuais seja nulo. Ora, a variação 
da energia total num intervalo de tempo dt é igual ao trabalho realizado pelas forças de 
vínculo durante os deslocamentos reais dr; = v;dt, que em geral não se anula, logo a 


energia total não pode permanecer constante. 


Os três últimos teoremas lançam uma nova luz sobre a origem das constantes de movi- 
mento fundamentais da mecânica, ao associarem as leis de conservação a propriedades 
geométricas do espaço-tempo. A homogeneidade e isotropia do espaço refletem-se na 
invariância da lagrangiana e dos vínculos sob translações e rotações, dando lugar à con- 
servação do momento linear e do momento angular. A homogeneidade temporal reflete-se 
na imutabilidade da lagrangiana e dos vínculos frente a uma mudança na origem do tempo 
(lagrangiana e vínculos sem dependência temporal explícita), dando lugar à conservação 


da energia. 


Quando há forças dissipativas presentes que podem ser descritas por uma função de 


dissipação F, o Teorema 2.6.1 não é mais verdadeiro e a Eq.(2.6.2) é substituída por 


dh SOF ƏL 
SS ge (2.6.8) 
k 


dt ok dt 
E Exercício 2.6.3. Deduza a Eq.(2.6.8). E 


Note que F, no que concerne à sua dependência funcional das velocidades generaliza- 


das, tem a mesma estrutura que a energia cinética. Assim, se as Eqs.(1.5.2) que definem 


2.7. TEOREMA DE NOETHER 83 


as coordenadas generalizadas não dependem explicitamente do tempo, h= E e F é uma 
função homogênea do segundo grau das velocidades. Neste caso (Lemos 1991), o teorema 


de Euler das funções homogêneas permite escrever (2.6.8) na forma 


a a (2.6.9) 


Se, em acréscimo às circunstâncias já especificadas, L não depender explicitamente do 


tempo, vale 


L =F , (2.6.10) 


já obtida por outros métodos, porém num contexto menos geral, na Seção 1.7. 


2.7 Teorema de Noether 


Na dinâmica lagrangiana a conexão geral entre propriedades de simetria (invariância) 
e quantidades conservadas é estabelecida por um importante teorema devido a Emmy 
Noether. Esse teorema (Noether 1918) contém como casos particulares todos os resultados 


discutidos nas Seções 2.5 e 2.6. 


Sejam X e W; funções conhecidas de (n + 1) variáveis reais e seja € um parâmetro 


infinitesimal arbitrário. Considere a transformação infinitesimal 


t — t=t+eX(q(t),t) , (2.7.1a) 


q(t) — glt) = a(t) + eVi(a(t),t) . (2.7.10) 


Dizemos que a integral de ação permanece invariante sob esta transformação se 


és = f” Le), LO a - / “(a(o SO sat =0 . (2.7.2) 
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Teorema de Noether. Dado um sistema mecanico com n graus de liberdade, se a 


ação é invariante sob a transformação (2.7.1) então a quantidade 


"OL 
Cs 


i=1 


(q.X — W;) — LX (2.7.3) 


qi 


é constante de movimento, onde L(q, q, t) é a lagrangiana do sistema. 


Demonstração. Nos cálculos que se seguem reteremos somente termos de primeira 


ordem em e. Notemos inicialmente que 


dt! ; dt T ! 
a -% ay RA) SLX (2.7.4) 
tendo sido usada a expansão binomial (1 +2)* =1+Ar+---. Temos, ainda, 
dg (t) dt dgi(t') AEN ; ; 
a = = = (1 — eX)(q; +i) = q; io 2.7.5 
= = Xi teh) = ht eE (2.7.5) 
onde 
& = Ý,- Gx . (2.7.6) 
Assim, a invariância da ação, isto é, 
t2 ; t2 
SS= | Liqte¥,g+e€,t4 SO + dt — f L(q,4,t)at 
ty tı 
to OL OL OL 
= V; + il X+LX pdt =0 2.7.7 
cf, BE ag at eae 


conduz imediatamente à condição de Noether 


e OD ni ABRO chat O 


i=l 
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já que € e o intervalo de integração sao arbitrários. Esta é a condição necessária e 
suficiente para que a ação seja invariante frente à transformação (2.7.1). Com o emprego 
das equações de Lagrange e das Eqs.(2.6.1) e (2.6.2), a condição de Noether (2.7.8) pode 


ser reescrita na forma 


E d /OL - OL + dh 
ou, equivalentemente, 
2? ol 
2 5 ` (4X —W;)- LX >}=0, (2.7.10) 
dt |Z 04; 


o que completa a demonstração do teorema. 


Segundo o Teorema 2.3.1, lagrangianas que só diferem pela derivada total em relação 
ao tempo de uma função arbitrária das coordenadas generalizadas e do tempo conduzem 
exatamente às mesmas equações de movimento. O teorema de Noether admite uma gener- 
alização importante que reflete esta propriedade das lagrangianas equivalentes. Suponha 
que a integral de ação seja quase-invariante sob a transformação infinitesimal (2.7.1), isto 


é, imagine que exista uma função G(q,t) tal que 


5S = “(eee SO ar- f” fola, SO | Glatt), fat=0 RR) 


Então a condição de Noether assume a forma 


£ OL . OL = óL . 
Sea + (hi aid E (2.7.12 
e a quantidade conservada associada a simetria é 
ae 2 BE 
C = (GX —W;)-LX+G. (2.7.13) 


1 Odi 


(3 
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E Exercício 2.7.1. Demonstre esta versão generalizada do teorema de Noether. E 


E Exemplo 2.7.1. Demonstre o Teorema 2.6.1 por meio do teorema de Noether. 


Solução: Considere um deslocamento puramente temporal, ou seja, tome a transformação 
(2.7.1) com UV; = 0 e X = 1. De acordo com a condição de Noether (2.7.8), a ação será invariante 
sob esta transformação se e somente se OL /Ôt = 0. Se este for o caso, por (2.7.3) concluímos que 


Be ðL 
h = Dita — L = constante , (2.7.14) 
i=1 


o que demonstra o Teorema (2.6.1). E 


E Exemplo 2.7.2. Demonstre o Teorema 2.5.3 recorrendo ao teorema de Noether. 


Solução: Defina q = 71,92 = ¥1,93 = 71,---;943N = ZN € tome d0 = en, com € = OO. 
As Egs.(2.5.10) são da forma (2.7.1) com X = 0, Yı = (A x r1)2, V2 = (À x ri) V3 = (À x 
ri)... Psy = (À x ry)-. Por outro lado, a invariância de S deve-se à invariância de £, pois 


não há mudança da variável temporal. Assim, se £ é invariante o teorema de Noether garante 
que 


3N N 
OL OL jus 
5 Gc wt 5 P - (û x r;) = constante , 
k=1 4k i=1 Oi 
ou seja, 
N 
n- 5 ri X pi = constante , 
i=1 
que reproduz a Eq.(2.5.20). E 
E Exercício 2.7.2. Prove o teorema (2.5.2) utilizando o teorema de Noether. a 


E Exemplo 2.7.3. (Lemos 1993) Considere um oscilador harmônico amortecido, cuja equação 
de movimento pode ser obtida da lagrangiana (Problema 1.14) 


2 
pd (Fe E TE?) | (2.7.15) 


Mostre que a ação é invariante sob a transformação finita (a é uma constante arbitrária) 
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t=t+a , aw(t)=e?V? x(t) , (2.7.16) 
e deduza que 
2 
o = o (Tar a My es) (2.7.17) 


é constante de movimento. 


Solução. Note que (2.7.16) consiste numa translação temporal acompanhada de uma di- 
latação espacial. Temos 


te [mdri mw? t2+a m mw 
Ps At 12 fine At Aa ,—Aa (1 2 O 2 es 
s= fre 15 (Gr) 5 x a= [e e (Se EE x”) dt 


=| MS = )d=as , (2.7.18) 


tendo sido feita a mudança de variável de integração t’ = t + a na segunda integral em (2.7.18). 
Portanto, a ação é invariante e o teorema de Noether se aplica. A versão infinitesimal das 
Egs.(2.7.16) é obtida fazendo a = e. Expandindo a exponencial até primeira ordem em e, resulta 


t=t+e , w(t) =2(t)- at), (2.7.19) 


donde, por comparação com (2.7.1) 
X=1 , V=->s. (2.7.20) 


Substituindo (2.7.20) em (2.7.3) com qı = x, UV; = WV e a soma reduzida a um único termo, 


resulta imediatamente a constante de movimento (2.7.17). E 


E Exercício 2.7.3. (i) Usando (2.7.15) e (2.7.20), demonstre a invariância da ação verificando 
que a condição de Noether (2.7.8) é satisfeita. (ii) Utilizando a equação de movimento do oscilador 
harmônico amortecido, prove diretamente que a quantidade C definida por (2.7.17) é constante 


de movimento. | 


Como vimos neste capítulo, a formulação de uma lei física na forma de um princípio 
variacional oferece importantes vantagens. Em primeiro lugar, torna manifesta a in- 


variância da referida lei sob transformações arbitrárias de coordenadas porque os princípios 
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variacionais independem das particulares coordenadas em que estejam expressos. Além 
disso, os princípios variacionais servem de base para cálculos aproximados em problemas 
que não se consegue resolver exatamente (Problema 2.3; Feynman, Leighton & Sands 
(1963), Vol. II, Cap. 19). 


Por outro lado, os princípios variacionais parecem contrabandear para a Física a noção 
de propósito ou finalidade, dotando os sistemas mecânicos de características antropomór- 
ficas. Será que uma partícula de algum modo sonda todas as trajetórias possíveis antes 
de se decidir por aquela que dá a menor ação? Por suscitar questões dessa natureza, 
os princípios variacionais, desde sua introdução na mecânica, vêm exercendo um grande 
fascínio sobre cientistas e filósofos. Até mesmo um físico da estatura de Max Planck chegou 
a advogar uma interpretação teleológica para o princípio da mínima ação e invocá-lo como 
argumento para a existência do Ser Supremo. O leitor inclinado a especulações metafísicas 
é remetido a Yourgrau & Mandelstam (1968) para uma estimulante discussão crítica dessas 


idéias e das implicações filosóficas dos princípios variacionais. 
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PROBLEMAS 


2.1. Determine as geodésicas de um cone com ângulo de abertura 2a. Descreva a forma 
da curva geodésica no caso em que seu ponto inicial é o vértice do cone, tomado como 


origem do sistema de coordenadas. 


2.2. Uma partícula move-se num plano vertical sob um campo gravitacional constante. 
Mostre que existe uma única solução ry(t) da equação de movimento com as condições 
de contorno r(0) = 0, r(T) = ro. Seja agora r(t) = ry(t) + H(t), com m(T) = n(0) = 0, 
uma outra trajetória qualquer obedecendo às mesmas condições de contorno. Fazendo 
uma integração por partes e usando a equação de movimento satisfeita por ry(t), mostre 
que a ação associada à trajetória r(t) é dada por Sfr] = Sfr] + (m/2) pa In/2dt e daí 


conclua que a ação é mínima para a trajetória física. 


2.3. Considere o problema de determinar o mínimo de Jl[y| = se ydx com y(0) = 0 e 
y(1) = 1. Tente uma solução aproximada da forma ya(x) = x? + ax(x — 1) e determine o 
valor ag do parâmetro a que fornece a melhor aproximação. Prove que a solução exata é 
y(x) = x. Faça um gráfico comparativo de ya, (x) e y(x). Compare o valor aproximado 


do mínimo, isto é, J[ya,|, com o valor exato J[y] e calcule o erro percentual cometido. 


2.4. No cálculo das variações, o problema de achar o extremo do funcional 


Jol = [0 lo), o yul2). gh (o),-+-9h (2), 0) de 


com as condições subsidiárias 


S tan), sino) (o), ole) ade = 6, i= Lem, 


1 


onde os ¢; são constantes, é chamado de problema isoperimétrico. Pode-se provar (Elsgoltz 
1969) que o extremo de Jly] é determinado por meio das equações de Euler para o 


funcional 


Jly] = [P (E+E as) dz , 


i=1 
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onde os multiplicadores de Lagrange A; são constantes. Use este resultado para determinar 
a forma de um cabo de comprimento £, flexível, inextensível e homogêneo, que pende de 
dois postes verticais. Levando em conta que a posição de equilíbrio do cabo é aquela em 
que sua energia potencial gravitacional é mínima, mostre que o cabo toma a forma da 
curva que minimiza Ely] = [?y/1+ y dx com a condição [VI Fy? dx = £L, e mostre 


que a solução é uma catenária. 
2.5. Mostre que as equações de Lagrange podem ser escritas na forma explícita 


M (PL OL, 


2 Dada a oi DO Og 


Prove que duas lagrangianas L(q,q,t) e L(q,q,t) geram equações de movimento idênticas 
se e somente se elas diferem pela derivada total em relação ao tempo de uma função 
arbitrária das coordenadas generalizadas e do tempo. Você deverá necessitar do resultado 


contido no Apêndice D. 


2.6. Considere a máquina de Atwood oscilante do Problema 1.5 no caso especial M = 3m. 


Prove diretamente que a quantidade 


: : 0 0 
I(r,7,0,0) = r°0 |ò cos 57 sen + gr? sen 5 cos? — 


é constante de movimento (Tufillaro 1986). 


2.7. Uma particula move-se no potencial gravitacional produzido pelas seguintes dis- 
tribuições de massa homogéneas: (i) esfera de raio R; (ii) paralelepípedo infinitamente 
longo com seção transversal quadrada; (iii) haste de comprimento (; (iv) disco de raio R; 
(v) cilindro infinitamente longo com seção transversal circular; (vi) plano infinito; (vii) 
plano semi-infinito; (viii) fio enrolado na forma de uma hélice infinita de raio R e passo 


p. Quais são as componentes de P e L que se conservam em cada caso? 


2.8. Uma partícula de massa unitária move-se ao longo de uma linha reta sujeita à força 
não-conservativa F = —yi2, com y constante. (i) Mostre que a equação de movimento da 
partícula pode ser obtida da lagrangiana L = e?!x?/2. (ii) Mostre que a integral de Jacobi 


h associada a esta lagrangiana é equivalente a ze?” = C,, onde C4 é uma constante. (iii) 
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Figura 2.7.1: Problema 2.9. 


Prove que a ação é invariante sob a transformação x’ = x+a, t = e*ºt para um certo 
valor de 8 (determine-o). Interprete geometricamente o significado desta transformação. 
(iv) Considerando a versão infinitesimal da transformação do item anterior, use o teorema 
de Noether para provar que (ytt — Nie?” = Cy = constante. (v) Combinando as duas 


constantes de movimento para eliminar t, prove que 


1 
z(t) = A+ cIn(B + 7) 


e verifique diretamente que esta é a solução geral da equação de movimento da partícula. 


2.9. O sistema representado na Fig. 2.7.1 é tal que a massa ma se move sem atrito sobre 
a mesa horizontal e a massa mı só pode movimentar-se verticalmente. Use o método 
dos multiplicadores de Lagrange para provar que a tensão no fio inextensível que une as 


partículas é dada por 


2 
T Rs Maimg Po 
T T 
mı + mo mers | ’ 


onde pg é o valor constante de mar20. No caso em que pọ = 0, determine a aceleração de 


queda da massa mı. 


2.10. Na chamada mecânica generalizada as lagrangianas contêm derivadas de ordem 


superior à primeira das coordenadas generalizadas. Dada uma lagrangiana da forma 
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L(q,4, 9, t) , mostre que o principio de Hamilton, com variação nula de q; e q; nos extremos 
temporais, dá lugar às equações de Lagrange 
2 
dt? \04; dt \ Oq; 


"Og 


Estenda este resultado para lagrangianas contendo derivadas de terceira ordem das co- 
ordenadas generalizadas. (ii) Mostre que a lagrangiana L = —mgqq/2 — kq?/2 gera a 
equação de movimento de um oscilador harmônico. Prove que esta lagrangiana difere da 


lagrangiana usual de um oscilador harmônico por uma derivada total em relação ao tempo. 


2.11. No caso de amortecimento fraco, mostre que com Q = (w?—?/4)'/? a lagrangiana 


2i + AD _ı [2t + Ax OE 
= tan — 
QN 


gera a equação de movimento de um oscilador harmônico amortecido (Havas 1957). Prove 
que a ação associada a esta lagrangiana é quase-invariante sob a dilatação espacial infinite- 
simal x (t) = (1+e)a(t) , t =t, isto é, que a Eq.(2.7.11) é verdadeira com G(x,t) = —t. 


Aplique em seguida o teorema de Noether generalizado para deduzir que 


2; 
tan ( SE) —Ot=6, 
x 


onde 6 é uma constante. Conjugue este resultado com a constante de movimento (2.7.17) 


para obter por meios puramente algébricos (Lemos 1993) 


a(t) = Ae? cos(Mt + ô) , 


que é a solução geral da equação de movimento do oscilador amortecido. 


2.12. Considere um sistema de N partículas em interação com lagrangiana L=T-V, 
onde T = S;mit?/2 e V só depende das distâncias r;; = |r; — r;| entre as partículas. 
Mostre que, sob uma transformação de Galileu r; = r; — vt, t = t, a lagrangiana 
transformada só difere da lagrangiana original pela derivada total de uma certa função 


F(r,,...,rw,t). Tomando v infinitesimal, mostre que a ação é quase invariante e, como 
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consequência da versão generalizada do teorema de Noether, obtenha a constante de movi- 
mento C = tP — MX, onde P é o momento linear total, M é a massa totale X é o 


vetor posição do centro de massa do sistema. 


2.13. O campo eletromagnético é invariante sob uma transformação de calibre dos po- 


tenciais definida por 


AS AN=A4VA ; ọ > Faga 
c Ot 


onde A(r,t) é uma função diferenciável arbitrária. De que maneira a lagrangiana (1.8.11) 


é afetada por esta transformação? As equações de movimento são alteradas? 


2.14. Um sistema com dois graus de liberdade tem lagrangiana 


L= T (i? +9) — (ax + By) , 


com a e 5 constantes. (i) Prove que a lagrangiana — e consequentemente a ação — é 


invariante sob a transformação infinitesimal 


r => t=rt+6 , yoyr=y-ea. 


Usando o teorema de Noether, prove que a quantidade A definida por 


A= m(ßi — ay) 


é constante de movimento. (ii) Introduzindo as novas coordenadas generalizadas x e y 


definidas por 


E=ar+Py , y=Pr-ay, 


mostre que uma das novas coordenadas nao aparece na lagrangiana expressa em termos 
de Z,¥,2,y. Prove que a quantidade A do item (i) é proporcional ao momento conjugado 


a essa coordenada cíclica e interprete geometricamente todo o procedimento realizado. 
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2.15. Uma partícula de massa m e carga elétrica e move-se num campo magnético 
uniforme B = Bk, cujo potencial vetor é A(r) = B x r/2. (i) Mostre que as equações de 
Lagrange para a partícula equivalem a v = —w x v e determine w em termos de B. (ii) 
Exprima a lagrangiana em coordenadas cilíndricas (p,y, z) e mostre que, embora y seja 
coordenada cíclica, a componente L, = mp? do momento angular não é conservada. 


Explique. 


2.16. Seja q; uma coordenada cíclica da lagrangiana L(g,q,t), de modo que o momento 
conjugado pp é constante de movimento. Se L for substituída por L = L + dF(q,t)/dt 
com 02F/ôqê #4 0, q; não será coordenada cíclica de L e o momento conjugado não 
se conservará. Mas sabemos que L e L produzem as mesmas equações de movimento. 
Resolva o aparente paradoxo: como é possível que as mesmas equações de movimento 
impliquem tanto conservação quanto não conservação? Escolhendo F = q?, discuta o caso 


da partícula livre unidimensional com L = q?/2. 


2.17. Reconsidere o Problema 1.12 pela técnica dos multiplicadores de Lagrange e deter- 


mine a força de vínculo sobre o bloco de massa m. 


2.18. Mostre que a lagrangiana do Problema 1.7 é quase-invariante sob uma translação 
infinitesimal x” = x +€ e encontre a constante de movimento correspondente via teorema 
de Noether. Usando a equação de movimento do sistema, verifique diretamente que a 


quantidade obtida pelo teorema de Noether é de fato constante de movimento. 


2.19. Uma partícula de massa m e vetor posição r move-se no potencial coulombiano 


ou gravitacional V = —«/r, onde r = |r|. (a) Mostre que o vetor de Laplace-Runge-Lenz 


A=pxL-ma- 
E 


é constante de movimento, onde L =r x p é o vetor momento angular. (b) Mostre que 
A está contido no plano da órbita. (c) Tomando o produto escalar de A por r, deduza 
a equação da órbita. Sugestão: r-(p x L) = L-L.(d) Mostre que a ecentricidade é dada 


por €= A/mk e que A aponta ao longo do eixo maior da órbita elíptica. 


2.20. Considere a lagrangiana unidimensional L = 12/2 — g/x2, com g constante. (i) 
Mostre que a ação é invariante sob a transformação finita a (t') = ex(t), t = et, 
onde a é uma constante arbitrária, e conclua, via teorema de Noether, que J = zt — 2Et 


é constante de movimento, com E denotando a energia total. (ii) Prove que a ação é 
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quase-invariante sob a transformação infinitesimal t = t + et?, a(t) = x(t) — etx(t) e 
daí conclua que K = Et? — tri + x?/2 é constante de movimento. (iii) Combinando os 


resultados dos itens (i) e (ii) obtenha a solução geral da equação de Lagrange para z(t). 


Capitulo 3 


CINEMATICA DA ROTACAO 


For a physicist mathematics is not just a tool by means of which phenomena can be 
calculated, it is the main source of concepts and principles by means of which new 
theories can be created. 


Freeman Dyson 


A dinâmica do corpo rígido é um capítulo da mecânica clássica que merece destaque 
não apenas por seu interesse intrínseco, mas também porque requer a introdução de con- 
ceitos físicos e técnicas matemáticas sumamente importantes. Antes, entretanto, de en- 
veredar pela dinâmica, é preciso introduzir métodos eficazes para descrever o movimento 
de corpos rígidos. Dedicaremos um espaço considerável ao estudo da cinemática da rotação 
na perspectiva de que diversos dos instrumentos matemáticos a serem desenvolvidos são 


de grande generalidade, encontrando ampla aplicação em outros domínios da física teórica. 


3.1 Transformações Ortogonais 


Um corpo rígido possui, em geral, seis graus de liberdade. Obviamente, três desses 
graus de liberdade correspondem às translações do corpo como um todo, ao passo que os 
outros três graus de liberdade descrevem as diferentes orientações do corpo relativamente a 
um sistema de eixos fixos no espaço. Um modo simples de especificar a orientação do corpo 
rígido consiste em estabelecer um sistema cartesiano fixo no corpo, isto é, que acompanha 
os seus movimentos, e considerar os ângulos que os eixos atados ao corpo formam com 
eixos paralelos aos que permanecem fixos no espaço (representados por linhas tracejadas 
na Fig. 3.1.1). 
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Figura 3.1.1: Sistemas de eixos fixos no espaço (x122%3) e solidários ao corpo rígido 
TATA NA 
(x12373). 


Seja » um sistema de coordenadas cartesianas (£1, £2, %3), com os correspondentes 
vetores unitários (ê,, ê», êg), representando eixos fixos no espaço, e seja X’ um sistema de 
coordenadas cartesianas (£1, %3, %}), cujos eixos permanecem solidários ao corpo rígido, 
com vetores unitários (64, 6,64), conforme a Fig. 3.1.2. Um vetor arbitrário g pode ser 


decomposto tanto na base de © quanto na de X’: 


3 
g = 9161 + gêz + 9363 => gjêj , (3.1.1a) 
j=l 
g = 9181 + 98 + g3ê3 = X 978; - (3.1.10) 
j=l 


Naturalmente, as componentes de g relativamente a 3 e X’ estão relacionadas entre si. 


Com efeito, 
3 3 
g =ê; g=} 98 ê=} ajg , 1=1,2,3, (3-1.2) 
ja j=l 
onde 
aij = ê; - ê; = cosseno do ângulo entre os eixos xi e £j . (3.1.3) 


As quantidades a;; — nove ao todo — são chamadas de cossenos diretores de X’ relati- 


vamente a 5. Portanto, as componentes de g em X” exprimem-se em termos de suas 
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Figura 3.1.2: 


componentes em X através de uma transformação linear cujos coeficiente são os cossenos 


diretores. 


As nove grandezas a;; não podem ser mutuamente independentes, pois bastam três 
quantidades para definir a orientação de X” relativamente a X. Para obter as condições a 
que os cossenos diretores devem estar sujeitos, basta levar em conta que o módulo de um 


vetor não depende da particular base em que ele é decomposto: 


3 3 
II DD HKD HR. (3.1.4) 
i=1 i=1 
Mas, fazendo uso da Eq.(3.1.2), 
3 3 3 3 3 3 
DnH=D O a airg) = X O Gagan) 95 gk (3.1.5) 
i=1 i=1 j=1 k=1 k,j=1 i=1 


Utilizando o símbolo delta de Kronecker 6,, introduzido no Apêndice A, é possível escrever 
2,24 Le 3 
gi +93 +93 => gigi = X. dj; - (3.1.7) 
i=1 kizi 


Comparando as equações (3.1.5) e (3.1.7), levando em consideração (3.1.4) e a arbi- 


trariedade de g1, 95,93, deduz-se 
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3 
Do aij dig = Ôjk . (3.1.7) 


i=1 


Estas são as condições obedecidas pelos nove cossenos diretores, mostrando que nem todos 


eles são independentes. 


As equações (3.1.2) constituem uma representação compacta das três equações 


/ 
Gy = 41191 T 01292 + 41393 , 


92 = am gr + A2292 + A2393 , (3.1.8) 


/ 
93 = 43191 T 43292 + 43393 . 


Equacoes deste tipo podem ser tornadas muito mais concisas por meio da notação matricial. 


Definindo as matrizes! 


gı gı Q11 Q12 413 
gz =| 92 » Is = 9% A= (aiz) = | G21 Q22 dos ) (3.1.9) 
93 93 a31 432 433 


as equações (3.1.8) podem expressar-se na forma 


Por outro lado, notando que a; = (A?) onde A” denota a transposta de A, e con- 


siderando a definição de produto de matrizes, a Eq.(3.1.7) é equivalente a 


A AT, (3.1.11) 
onde 
100 
T= (dj) =| 0 1 0 (3.1.12) 
00 1 


lNeste capítulo usaremos letras maiúsculas caligráficas em negrito, tais como A, para representar 
matrizes quadradas. Quando escrito na forma de matriz-coluna, um vetor será representado por uma 
letra minúscula em negrito com um subscrito indicando a base em que ele está expresso, tal como gy. 
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é a matriz identidade 3 x 3. 


m Exercício 3.1.1. Prove que a transformação inversa de (3.1.2) é 


3 
gi =X ajig (3.1.13) 
j=1 
e, usando a invariância de g.g, prove que 
3 
5 Qji Aki = Ojk - (3.1.14) 
i=l 


Mostre que em notação matricial esta equação toma a forma? 


AA =I. (3.1.15) 


Demonstre, ainda, as leis de transformação direta e inversa 


3 
=> ajê 8 => aê. (3.1.16) 
l=1 


As bases {€1, €2, 63} e {ê1, €5, €5} são compostas por vetores unitários e mutuamente ortogonais, 
logo valem as equações 


êj 6, = ê; 84 = Oye (3.1.17) 
Deduza, finalmente, (3.1.7) e (3.1.14) a partir de (3.1.17). E 


A matriz de transformação entre sistemas cartesianos obedece às equações (3.1.11) e 


(3.1.15), as quais são equivalentes a 


ASA (3.1.18) 


Qualquer matriz que obedeça a esta última equação é dita uma matriz ortogonal, e a 


transformação linear associada (3.1.2) é chamada de transformação ortogonal. 


2Para matrizes finitas as Eq.(3.1.11) e (3.1.15) são equivalentes, isto é, uma é verdadeira se e somente 
se a outra é verdadeira (vide o Apêndice C). Esta propriedade não se estende a matrizes infinitas. 
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Figura 3.1.3: Rotação num plano. 


E Exemplo 3.1.1 (Rotações no plano). Neste caso bidimensional (Fig. 3.1.3) temos 


x, = £1 cos 6+ 22 send , (3.1.19a) 
Lo =—21 sen ġ + £2 cos à . (3.1.19b) 


A matriz associada a esta transformação ortogonal é 


A-( cosa > , (3.1.20) 


—sengd cos q 


e um único parâmetro — o ângulo de rotação ¢ — especifica completamente a transformação .E 


E Exercício 3.1.3. Usando a definição (3.1.3) e a equação (3.1.2) com g = r, demonstre 


(3.1.19). Verifique que a matriz A dada por (3.1.20) é ortogonal. E 


A matriz de transformação A pode ser encarada como uma transformação linear que, 
conforme a Eq.(3.1.10), age sobre as componentes de um vetor em È e as transforma nas 
componentes do mesmo vetor em X'. Esta interpretação da Eq.(3.1.10), em que o vetor 
permanece o mesmo e o que muda é o sistema de coordenadas, é denominada ponto de vista 
passivo. Alternativamente, A pode ser encarado como um operador que transforma o vetor 
g num outro vetor g', ambos considerados expressos no mesmo sistema de coordenadas. 
Esta forma de interpretar a transformação executada pela matriz A é conhecida como 
ponto de vista ativo, e em muitas ocasiões, como veremos, revela-se mais conveniente 


do que o ponto da vista passivo. Naturalmente, a operação específica representada por 
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A dependerá da interpretação adotada. Assim, por exemplo, uma rotação dos eixos 
coordenados mantendo o vetor fixo faz o mesmo efeito que manter os eixos fixos e girar o 
vetor do mesmo ângulo, porém no sentido contrário. No Exemplo 3.1.1, se A representa 
uma rotação anti-horária de um ângulo ¢ dos eixos coordenados, ela corresponderá a uma 


rotação horária do mesmo ângulo q aplicada ao vetor, e vice-versa. 


E necessário examinar transformações ortogonais sucessivas. Seja B = (b;;) a matriz 
de transformação de © para X’, e A = (a;;) a matriz de transformação de X’ para X”, de 


modo que 


=> bijg; , (3.1.21) 
j 


Ik =D arig; + (3.1.22) 


Conseqüentemente, 
Jk = J ari bij gj = X 0 ans bij) 95 = DL Cki 9 » Ra, 
a J a j 


onde os cy; definidos por 


Chg = D Ons bi (3.1.24) 


são os elementos da matriz C que realiza a transformação direta de © para X”. De acordo 


com a definição de produto de matrizes, a Eq.(3.1.24) é equivalente a 


C- AB. (3.1.25) 


É imprescindível observar a ordem dos fatores nesta última equação, uma vez que o produto 
de matrizes não é comutativo. É intuitivamente claro que duas rotações sucessivas são 
equivalentes a uma única rotação, de sorte que, se A e B são matrizes ortogonais, seu 
produto também tem que ser ortogonal. Para provar que C é ortogonal, basta mostrar 


que C satisfaz (3.1.15), por exemplo. Como primeiro passo, note que 
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cc’ = AB(AB)’ = ABB A”, 


onde usamos a identidade (AB)? = BT A”. Mas, com o uso da ortogonalidade de B e de 


A, podemos escrever 


cc’ SAIA Ss AA =I, 


o que comprova a ortogonalidade de C. 


O conjunto das matrizes ortogonais goza das seguintes propriedades: 


(1) Se A e B são elementos do conjunto, o produto AB também o é. 

(2) O produto é associativo, isto é, A(BC) = (AB)C. 

(3) O conjunto contém um elemento T, chamado identidade, tal que AT = IA 
para qualquer elemento A do conjunto. 

(4) Para cada elemento A do conjunto existe um único elemento B do conjunto 
tal que AB = BA=T. O elemento B é denominado inverso de A e denota- 
do por A. 


A primeira propriedade já foi demonstrada, a segunda é satisfeita porque o produto de ma- 
trizes é associativo, e a terceira é obviamente verdadeira. A quarta propriedade é a única 
que ainda requer prova. Mas para qualquer matriz ortogonal a única inversa simplesmente 
coincide com a transposta, e verifica-se imediatamente que a transposta de uma matriz or- 


togonal é também uma matriz ortogonal porque podemos escrever (ADJTA! = AAT = I. 


Um conjunto de elementos no qual está definida uma lei de composição — também 
chamada de multiplicação ou produto — com as quatro propriedades acima constitui um 
grupo (Hamermesh 1962; Tung 1985). O grupo das matrizes ortogonais 3 x 3 é denotado 
por O(3). A teoria dos grupos desempenha um papel importantíssimo nos mais diversos 


ramos da física teórica atual, principalmente na física das partículas elementares. 


3.2 Deslocamentos Possíveis de um Corpo Rígido 


O determinante de uma matriz ortogonal só pode assumir certos valores restritos. De 


fato, tomando o determinante de (3.1.15) resulta 
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(det A)(det AD) =1 => (det A)?=1, (3.2.1) 


onde utilizamos as seguintes e bem conhecidas propriedades dos determinantes: det( AB) = 
(det A) (det B); det A” = det A. Portanto, uma matriz ortogonal só pode ter determi- 


nante igual a +1 ou —1. Uma matriz ortogonal simples com determinante —1 é 


—1 0 0 
T= -I = 0 -1 0 ; (3.2.2) 
0 0 —1 
A transformação efetuada por T é 
J=- » G=-G9 » J3 =-93 , (3.2.3) 


que corresponde a uma inversão dos eixos coordenados. 


Uma inversão transforma um sistema cartesiano dextrógiro num sistema cartesiano 
levógiro. É claro, portanto, que uma inversão não corresponde a um deslocamento possível 
de um corpo rígido. Dito de outra forma, uma vez escolhido um sistema cartesiano 
dextrógiro fixo no corpo rígido, nenhum deslocamento físico do corpo pode transmutar 
o referido sistema cartesiano em levógiro, salvo se o corpo for deformável, o que não é 
o caso por hipótese. Por outro lado, qualquer matriz ortogonal com determinante —1 
pode ser escrita na forma A = (—I)(—A) = TB onde det B = det(- A) = +1, isto 
é, A contém uma inversão dos eixos e não representa um deslocamento possível de um 
corpo rígido. Matrizes ortogonais com determinante +1 são ditas próprias, ao passo que 
aquelas com determinante —1 são ditas impróprias. Concluímos, assim, que somente as 
transformações ortogonais próprias correspondem a deslocamentos possíveis de um corpo 
rígido. Demonstra-se facilmente que o conjunto das transformações ortogonais próprias 


constitui um grupo, chamado de grupo de rotações e denotado por SO(3). 


Um resultado clássico que revela uma das características fundamentais do movimento 


de um corpo rígido foi estabelecido por Euler no século XVIII, mais precisamente em 1776. 


Teorema 3.2.1 (Euler). O deslocamento mais geral de um corpo rígido com um ponto 


fixo é uma rotação em torno de algum eixo. 


Demonstração. Em vez da prova geométrica tradicional, recorreremos às técnicas 


algébricas previamente desenvolvidas, o que conferirá à demonstração um caráter bastante 
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instrutivo. Antes, porém, é necessário esclarecer melhor o conteúdo do teorema. Suponha 
que o corpo rígido esteja numa configuração inicial e, após mover-se de forma arbitrária em 
torno de um ponto fixo, atinja uma configuração final. Como já discutimos, a configuração 
final resulta da aplicação de uma transformação ortogonal própria à configuração inicial. 
Segundo o enunciado do teorema de Euler, a configuração final pode ser obtida por meio 
de uma única rotação em torno de algum eixo contendo o ponto fixo, isto é, uma rotação 
em torno de um ponto é sempre equivalente a uma rotação em torno de um eixo passando 
pelo ponto. Mas um vetor ao longo do eixo de rotação fica inalterado, suas componentes 
antes e depois da rotação permanecem as mesmas. Se A é a matriz ortogonal própria que 
leva o corpo da sua configuração inicial à final, o teorema de Euler estará demonstrado 


desde que se prove que existe um netor não-nulo n tal que 


An=n (3.2.4) 


ou, equivalentemente, 


(A-T)n=0. (3.2.5) 


Se a matriz (A — J) for inversível, multiplicando-se (3.2.5) pela esquerda por (A — 1)! 
deduz-se que n = 0. Conseqiientemente, existirá n O satisfazendo (3.2.5) se e somente 


se (A — I) não possuir inversa, isto é, se e somente se 


det(A—I)=0. (3.2.6) 


Em suma, demonstrar o teorema de Euler equivale a provar a veracidade de (3.2.6). A 


partir da identidade 


(A-DA = AA — A" = I — A! =(-D(A-D=(-ID(A-D” (3.2.7) 


deduz-se 


det(A — I) det A = det(—I) det(A — I) = — det(A — T) . (3.2.8) 
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Usando det A = 1, a Eq.(3.2.8) implica 


det(A — I) = -det(A — I) , (3.2.9) 


da qual infere-se (3.2.6), completando a demonstração do teorema. o 


A dimensionalidade do espaço entra de forma crucial na demonstração acima. Num 
espaço de dimensão par, det(—I) = 1 e o argumento anterior fracassa. Por exemplo, 
num espaço bidimensional nenhum vetor do referido espaço é deixado inalterado por uma 
rotação. De fato, para uma rotação num plano o eixo de rotação é perpendicular ao 
plano e, em conseqüência, qualquer vetor paralelo ao eixo não pertence ao plano. Em 
síntese, o teorema de Euler não vale em espaços de dimensão par. O teorema de Euler foi 


generalizado por Chasles, em 1830, nos seguintes termos. 


Teorema 3.2.2 (Chasles). O deslocamento mais geral possível de um corpo rígido é 
uma translação acompanhada de uma rotação. O eixo de rotação pode ser escolhido de 


tal modo que a translação seja paralela a este eixo. 


A primeira parte do teorema de Chasles é óbvia, pois a remoção do vínculo de mover-se 
com um ponto fixo introduz três graus de liberdade de translação para o corpo. Uma prova 
geométrica da segunda parte do teorema de Chasles pode ser encontrada em Whittaker 
(1944) ou Pars (1965). Uma demonstraçãomoderna, com o emprego de métodos puramente 


algébricos, está disponível em Corben & Stehle (1962). 


3.3 Ângulos de Euler 


Numa formulação lagrangiana da dinâmica do corpo rígido, os nove cossenos dire- 
tores a;; não constituem as coordenadas mais convenientes para descrever a orientação 
instantânea de um corpo rígido por não serem independentes entre si. As nove equações 
(3.1.7) impõem apenas seis condições sobre os cossenos diretores, de modo que eles po- 
dem ser expressos em função de três parâmetros independentes. Com efeito, há três 
condições distintas correspondentes à parte diagonal das Eqs.(3.1.7), mas as seis condições 
correspondentes à parte fora da diagonal (i 4 j) são idênticas aos pares. Por exemplo, a 


equação (3.1.7) com j = 1, k = 2 é igual àquela obtida pela escolha j = 2, k = 1. 
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Do ponto de vista prático, uma forma simples e conveniente, embora assimétrica, 
de parametrizar a matriz de rotação é mediante os ângulos de Euler. A transformação 
do sistema cartesiano X(x, y,z) para o sistema X'(x',y',2') é realizada em três estágios 


sucessivos, cada um deles servindo para definir um dos ângulos de Euler (Fig. 3.3.1). 
: ; : 7 D 
(a) Rotação dos eixos (x,y,z) em torno do eixo z do ângulo @: (x,y,z) —> (E,n,0). 
As equações de transformação confundem-se com as equações (3.1.20) com 2 = € e 


x =n, acrescidas da equação x4 = ¢ = z. Logo, a matriz de rotação D escreve-se 


cos@ send 0 
D= | -senó coso 0 |. (3.3.1) 
0 0 1 
(b) Rotação dos eixos (€, n, Ç) em torno do eixo € do ângulo 0: (£,7,¢) a (eye. 


Por analogia com (3.1.20), as equações de transformação têm a forma 


=, 
n =n cos0+C sené , 
¢’ =—n sen b + Ċ cos 6 , 


donde 


1 0 0 
C= | 0 cos sen |. (3.3.2) 
O —sen@ cos 6 
O eixo € é chamado de linha nodal. 
(c) Rotação dos eixos (€', n’, ¢’) em torno do eixo ¢’ do ângulo y : (€',7',¢’) EA (sae): 
A matriz B representa uma rotação em torno do terceiro eixo, portanto tem a mesma 


forma que D: 


cos% seny O 
B= | —-seny cosy 0] . (3.3.3) 
0 0 1 


A rotação (x,y,z) — (x',y', 2’) é executada por A, = BCD. Um cálculo direto fornece 
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Figura 3.3.1: Ângulos de Euler 


cos wy cos @ — cos 6 seng sen y% cos y seng@+cos 0 coso seny seny send 
A, = | —seny cos ġ — cos O seng cos) — seny sen ġ + cos O cos¢ cosy cos % send 
sen 0 sen@ — sen 6 cos ġ cos 0 
(3.3.4) 
ht 7 -1_ AT : 
A transformação inversa (2',y', 2’) — (x,y,z) é efetuada por AT = A, ou seja, 


cos wy cos @ — cos 6 sen¢@ seny —seny cos P— cos 0 seno cos) send send 
A;' = | cos % sen ġ + cos 0 cos seny —senwsend+cos 0 coso cosy —send coso 
sen yw sen 6 cos w sen 0 cos 0 
(3.3.5) 


Em virtude de sua definição, o domínio dos ângulos de Euler é 
0O<P<LM, OLOT, OLYL. (3.3.6) 


3.4 Rotações Infinitesimais e Velocidade Angular 


As equações de movimento de um corpo rígido são equações diferenciais, e sua formulação 


requer o estudo de rotações do corpo durante um intervalo de tempo infinitesimal. Seja g 
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um vetor arbitrário submetido a uma rotação infinitesimal anti-horíia de um ângulo d® 
em torno de um eixo definido pelo vetor unitário n (ponto de vista ativo). Conforme as 
Egs.(2.5.5) e (2.5.10), 


g =g+dQxg (3.4.1) 


onde 


dO = dd. (3.4.2) 


No caso de rotações sucessivas, com vetores associados dQ, e dfl5, escrevemos 


g =g+dQ, xg (3.4.3) 


g" =g' +d, xg, (3.4.4) 


donde, desprezando infinitésimos de segunda ordem, 


g" =g +d Xg , (3.4.5) 


com 


Este último resultado prova que rotações infinitesimais são comutativas (dQ, = dQə21) 
em decorrência da comutatividade da soma de vetores. Além disso, o vetor associado a 
rotações infinitesimais sucessivas é a soma dos vetores associados às rotações infinitesimais 


individuais, propriedade que será de grande valia para os desenvolvimentos subseqüentes. 


Vale a pena analisar rotações infinitesimais em linguagem matricial. Adotando o ponto 


de vista ativo, a equação (3.4.1) pode ser escrita na forma 


Cs =Ags=(I+e)gs , (3.4.7) 
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onde € é uma matriz infinitesimal. A comutatividade das rotações infinitesimais é facil- 
mente verificada, já que, com o abandono de infinitésimos de segunda ordem e levando em 


conta que a soma de matrizes é comutativa, 


AA, = (I + €,)(I + E2) = I+ E1 F E2 = I+ E2 + E1 = AA, > (3.4.8) 


Por outro lado, como A = I + e representa uma rotação, A deve ser matriz ortogonal. 


Logo 


I= AA =(Ftee\it+e)=T+e+e? > e" = e. (3.4.9) 


Uma matriz € que obedece à equação (3.4.9) é dita anti-simétrica. Em termos dos elementos 


ei; de € a Eq.(3.4.9) equivale a e;; = —e;;. Portanto, a forma mais geral possível da matriz 
E é 
0 aß 
e=|-a Oy]. (3.4.10) 
=p =y 0 


Exigindo que as componentes de (3.4.7) sejam idênticas às de (3.4.1) obtém-se facilmente 


0 —dOs dO 
ce | ddr. 0 =dor o (3.4.11) 
= dO 20 


Embora, como acabamos de ver, seja possível associar um vetor a cada rotação infinitesimal 
de tal modo que o vetor associado a duas rotações sucessivas seja a soma dos vetores 


associados às rotações individuais, tal correspondência não é possível para rotações finitas.’ 


Em geral, a taxa de variação temporal de um vetor medida num sistema de referência 
solidário a um corpo rígido em rotação não coincidirá com aquela observada de um referen- 
cial inercial externo ao corpo. Por exemplo, se o vetor representar a posição de um ponto 


fixo do corpo rígido, sua taxa de variação temporal será zero em relação ao sistema de eixos 


3Um estudo detalhado de rotações finitas pode ser encontrado em Konopinski (1969). Vide, também, 
o Exemplo 4.2.1 do próximo capítulo. 
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fixos no corpo, mas não será nula relativamente ao sistema inercial de eixos em relação 
ao qual o corpo encontra-se em rotação. Considere um intervalo de tempo infinitesimal dt 


durante o qual um vetor arbitrário g varia. Intuitivamente, podemos escrever 


(dg inercial = (dg) corpo T (dg)rot ; (3.4.12) 


pois a diferença entre os dois sistemas deve-se exclusivamente à rotação do corpo. Mas 
(dg)rot é conseqüência de uma rotação infinitesimal de g juntamente com os eixos fixos no 


corpo, isto é, 


(dg)rot = dQ xg , (3.4.13) 


como se infere da Eq.(3.4.1). A utilização deste último resultado em (3.4.12) conduz a 


dg dg 
= = — 3.4.14 
dt e dt "S ad E l ) 
onde 
dQ dọ 
REA .4.1 
dt dt. ane) 


é a velocidade angular do corpo rígido no instante t. Note que o módulo de w é a taxa de 
rotação instantânea, ao passo que sua direção é paralela ao eixo instantâneo de rotação 


caracterizado pelo vetor unitário n. 


A importante equação (3.4.14) pode ser deduzida de uma maneira mais rigorosa, que 
possui a virtude adicional de tornar mais claro o significado de cada um dos seus termos. 
Sejam (8,12, os vetores unitários do sistema cartesiano inercial e (812, os unitários do 


sistema cartesiano atado ao corpo rígido. Podemos escrever 


3 3 
g=) gê =D gê; . (3.4.16) 
i=1 i=1 


Para um observador inercial os ê; são constantes no tempo, mas os é; variam com o tempo 
porque giram juntamente com o corpo. Há, portanto, dois modos distintos de calcular 
(dg/ dt) inercial 5a saber, 
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dg à dg; 
a = pee 3.4.17 
( dt ) > dt l l a) 
e 
dg 3 dg! sa 3., dê! 
= = — ê, ; 3.4.17b 
( dt inercial 2 dt Si ag 2 g; dt ( ) 


A equação (3.4.17a) define (dg/dt)inercial €, analogamente, (dg/dt) corpo é definida por 


dg 3 dg; 
BEA = i e., 3.4.18 
( dt ) corpo > t k l ) 


Esta última definição é perfeitamente natural visto que, para um observador montado 
no corpo rígido, os vetores unitários ê; são constantes. Mas, no intervalo de tempo dt 
o sistema móvel de eixos sofre uma rotação infinitesimal, o mesmo ocorrendo com cada 


unitário ê;, isto é, 
dê, = dQ x ê , (3.4.19) 


onde usamos (3.4.13) com g = &. Substituindo (3.4.18) e (3.4.19) em (3.4.17b) resulta 


dg dg É 1 Al dg 
— = — WU Xe = Era Ww X , 
dt ) inercial ( dt ) corpo x > " ‘ dt corpo is ya Ae i 


que coincide com (3.4.14). 


A igualdade (3.4.14) é válida qualquer que seja o vetor g. Isto permite interpretá-la 
não apenas como uma mera igualdade de vetores, mas como refletindo uma equivalência 
entre operadores lineares que atuam sobre vetores. Esta igualdade entre operadores pode 


ser convenientemente expressa na forma simbólica 


d d 
B = Es A 3.4.20 
( à) inercial dt ) corpo y E 
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Figura 3.4.1: Sistemas de coordenadas fixos em dois pontos distintos de um corpo rigido. 


E Exercício 3.4.1. Mostre que (d/dt)inerciat = (d/dt) corpo quando atuando sobre um escalar. 


Sugestão: considere o escalar s = g - h. E 


Intuitivamente, espera-se que o vetor velocidade angular seja uma propriedade do 
corpo rígido como um todo, independente, portanto, do ponto escolhido como origem do 
sistema de coordenadas fixo no corpo. No entanto, uma demonstração rigorosa desse fato 
é recomendável (Lemos 2000b). Na Fig. 3.4.1 X é um sistema de coordenadas inercial, 
ao passo que X| e X, são dois sistemas de eixos fixos no corpo, com origens O, e 
Os. Seja r o vetor posição de um ponto P qualquer do corpo rígido. Uma vez que 
r=R,+r,;= Rə + r2, temos 


5) ea (=) (Z) 
ms = | = —. + Wx ry (3.4.21) 
(5 a Ro ee 


e, analogamente, 


dr dR» 
— | =|[— 3.4.22 
E dt ) teen l l ) 


porque, sendo P um ponto do corpo, rı e rə são vetores constantes do ponto de vista dos 
sistemas de coordenadas X} e 55. Pondo R = Rs — R; , de (3.4.21) e (3.4.22) deduz-se 


(F) = w1 X ri~ wo XT9. (3.4.23) 
dt j 
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Por outro lado, 


dR dR 
sami = | — + wi x R= Wi X R , (3.4.24) 
dt j> dt j sy 
1 
pois R é um vetor constante relativamente ao sistema de coordenadas X} atado ao corpo. 
Combinando (3.4.23) e (3.4.24) obtém-se 


W1 X R= Wy X ri — Wo X r2 (3.4.25) 


ou, já que R = rı — r2, 


(Ww = w1) X r2 = 0. (3.4.26) 


Como P é um ponto qualquer do corpo rígido, rə é arbitrário e, conseqüentemente, 


w = w1, completando a demonstração. 


Alguns problemas importantes da dinâmica do corpo rígido exigem que se exprima 
o vetor velocidade angular em termos dos ângulos de Euler. Uma rotação infinitesimal 
do corpo rígido é o resultado de três rotações infinitesimais sucessivas cujas velocidades 
angulares têm, respectivamente, magnitudes d, ô, w. Sejam wg, Wg € Wy OS vetores 
velocidade angular correspondentes. O vetor velocidade angular w é dado simplesmente 


por 


w = wg t wW F Wwy (3.4.27) 


em virtude da Eq.(3.4.6). As componentes de w podem ser obtidas tanto ao longo dos 
eixos inerciais (x, y, z) quanto dos eixos fixos no corpo (x',y', z’). Por sua maior utilidade, 


consideraremos este último caso. 


Evidentemente, o vetor velocidade angular w depende linearmente de 6,0 e 4. 
Portanto, para encontrar a forma geral de w podemos fixar um par de ângulos de Euler 
de cada vez, determinar a velocidade angular associada à variação do terceiro ângulo e 


depois somar os resultados (Epstein 1982). Fixando 0 e w, 0 eixo z, que é fixo no espaço, 
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também torna-se fixo no corpo. Logo, z é o eixo de rotação e w é um vetor paralelo ao 


eixo z, com componente ¢, de modo que 


(Wo) a! 0 ó sen 0 sen y 
(wey | =A | 9 | = ġsenð cosy |. (3.4.28) 
(ws) Q $ cos 0 


Fixando agora ¢ e w, a linha nodal torna-se fixa no espaço e no corpo, logo é o eixo de 
rotação. Conseqüentemente, wọ é um vetor que só possui a componente O paralela ao 


eixo €’, de modo que 


(we) x 6 Ê cos Y 
(wo)y | =B| 0 |=| -seny |. (3.4.29) 
(wo) 2 0 0 


Finalmente, com 6 e @ fixos o eixo 2”, que é fixo no corpo, torna-se fixo no espaço. 
Logo, z” é o eixo de rotação e wy é um vetor com componente 1) ao longo eixo 2”, não 
sendo necessário aplicar-lhe qualquer matriz de transformação. Reunindo as componentes 


correspondentes chega-se ao resultado final 


Wy = senf seny +6 cos y , 
Wy! = dsend cos Y — ô seny , (3.4.30) 


wy =} +ġ cos 8 . 


E Exercício 3.4.2. Prove que 
wz = Ê cos ġ +) send send , 


Wy = Ê send — b sen 0 cos q , (3.4.31) 


ws = ġ +) cos 8 


são as componentes da velocidade angular ao longo dos eixos fixos no espaço. E 
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3.5 Grupo de Rotações e Geradores Infinitesimais 


Com a ajuda da Eq.(3.4.11) podemos escrever a Eq.(3.4.7) na forma 


9 = Ag = (I + Jı dQ) + J2 dO + J3dQ3)Q , (3.5.1) 
onde 
0 0 0 00 1 0 —1 0 
Fes OO St) cg Woe) Otelo do): (3.5.2) 
0 1 0 —1 0 0 0 0 0 


As matrizes J; são chamadas de geradores infinitesimais! do grupo de rotações SO(3). 


E Exercício 3.5.1. Prove que as matrizes J; , i = 1,2,3 , satisfazem a álgebra 


onde (i,j,k) é uma permutação cíclica de (1,2,3) e [A,B] = AB — BA é o comutador das 
matrizes 4 e B. Mostre que, equivalentemente, pode-se escrever 


3 
Jasi =y cn Te, (3.5.30) 
k=1 
onde €ijk é o símbolo de Levi-Civita definido no Apêndice A. E 


A matriz que executa uma rotação finita de um vetor” de um ângulo a em torno 
da direção n pode ser obtida aplicando N rotações infinitesimais sucessivas do mesmo 


ângulo a/N e passando ao limite N > co: 


N a 


Assim, demonstramos que uma rotação finita exprime-se em termos da função exponencial 


4A rigor, as matrizes J; constituem uma representação particular dos geradores do grupo de rotações. 
“Sentido anti-horário e ponto de vista ativo. 
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da matriz n- J = nıJı + noJo + nsJ3. Não há nada de misterioso na exponencial de 


uma matriz. Por definição, 


A | A A. Ree 
e =I+A4 9! T 3] E o (3.5.5) 


onde A e suas potências são matrizes nxn. A série (3.5.5) é sempre convergente (Courant 
& Hilbert 1953). 


A matriz J, é o gerador das rotações infinitesimais em torno do k-ésimo eixo carte- 
siano e todas as matrizes do grupo de rotações tridimensionais SO(3) podem ser repre- 


— ad 


sentadas na forma R(a) , onde a = ah. As matrizes R(a) formam um grupo 


de Lie cujos geradores obedecem à álgebra de Lie associada ao grupo, Egs.(3.5.3). As 
quantidades €;;, que aparecem na Eq.(3.5.3b) são chamadas de constantes de estrutura 


da álgebra de Lie do grupo de rotações tridimensionais. 
E Exercício 3.5.2. Usando a identidade 


det eA = A : (3.5.6) 


prove que todas as matrizes do grupo SO(3) tém determinante igual a 1. E 


3.6 Dinâmica em Referenciais Não-Inerciais 


Sejam È e X’ sistemas de referência com origens coincidentes, sendo 3 um sistema 
inercial e X’ um sistema girante com velocidade angular w. Seja r o vetor posição de uma 


partícula de massa m cuja equação de movimento em X escreve-se 


= 
mi“) =F, (3.6.1) 
& z 


onde F é a resultante das forças sobre a partícula. Usando a Eq.(3.4.14) temos 


eU =, smactios (3.6.2) 
Va=| H a H) r=vt+wxr, 6. 
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Figura 3.6.1: Situação do Exercício 3.6.1. 


onde V;n é a velocidade da partícula no referencial inercial 3 e v denota a velocidade 
da partícula no sistema de referência girante, pois, devido à coincidência das origens, r 
também é o vetor posição da partícula relativamente a ©’. Com o uso repetido de (3.4.14) 


deduz-se 


dr AV in dVin + wx dv dw xr 2w xv +wx (w x r) 
dt? jy dt Jy dt Jy dt pa dt 


(3.6.3) 


A Eq.(3.4.14) com g = w mostra que a aceleração angular é a mesma nos dois referenciais, 
daí a desnecessidade de subscrito em dw/dt nesta última equação. Denotando por a = 
(dv/dt)sy a aceleração da partícula no referencial girante e usando (3.6.1), obtém-se, 


finalmente, a equação de movimento da partícula no sistema de referência girante: 


ma =F + 2my x w + mw x (r x w) + me x Ë (3.6.4) 


Para um observador no referencial não-inercial X’ tudo se passa como se a partícula es- 
tivesse sujeita a uma força efetiva que é a soma da força usual F com: um primeiro termo 
conhecido como força de Coriolis; um segundo termo, quadrático em w, chamado de força 
centrífuga; um terceiro termo proporcional à aceleração angular do sistema de referência 


não-inercial, às vezes chamado de força de Euler. 


3.6. DINAMICA EM REFERENCIAIS NAO-INERCIAIS 119 


Figura 3.6.2: Referencial girante fixo na superficie da Terra. 


E Exercício 3.6.1. Se as origens de © e X’ nao coincidirem (Fig. 3.6.1), mostre que, em 
lugar de (3.6.4), teremos 


dw 
ma =F — may + 2mv xw + mw x (r xw) + mr x — , (3.6.5) 


dt 


onde ay = (d*h/dt”)s é a aceleração da origem de X’ em relação a X. E 


Como uma das aplicações mais importantes dos desenvolvimentos anteriores, considere 
o movimento de uma partícula nas imediações da superfície da Terra. Será conveniente 
introduzir o sistema de eixos que acompanha a rotação da Terra indicado na Fig. 3.6.2. O 
eixo z é vertical, isto é, ortogonal à superfície da Terra; o eixo x é tangente ao meridiano 
apontando para o sul; o eixo y é tangente ao paralelo apontando para o leste. A latitude 
do local da superfície da Terra escolhido como origem do sistema cartesiano xyz é À. 
Tomando a origem do sistema inercial © no centro da Terra, o vetor posição da origem 
do sistema girante é R = Rk, onde R é raio da Terra. Portanto, R é um vetor constante 
no referencial girante atado à superfície da Terra, e o uso repetido da Eq.(3.4.14) fornece 


imediatamente 


a = m( T) =w x (w xR), (3.6.6) 


onde usamos dw/dt = 0, pois a velocidade angular da Terra é praticamente constante. 


Este resultado substituído em (3.6.5) dá lugar a 
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ma =T + mg + mw x (R x w) + 2mv xw + mw x (r xw), (3.6.7) 


onde tomamos F = mg + T, com T denotando qualquer força adicional ao peso que esteja 


agindo sobre a particula. A Eq.(3.6.6) pode ser escrita na forma 


ma=T + mge + 2mv xw + mw x (r xw), (3.6.8) 


onde 


Sof =g+wx(Rxuw) (3.6.9) 


é a aceleração da gravidade efetiva. Para justificar esta denominação, considere um fio de 
prumo, isto é, uma partícula de massa m suspensa por um fio sujeito à tensão T e em 


equilíbrio na origem (r = 0) do sistema de coordenadas. Pela Eq.(3.6.7) 


T+ mgop = 0 , (3.6.10) 


ou seja, a direção do fio é determinada pelo vetor aceleração da gravidade efetiva. O vetor 
Zef não aponta exatamente na direção do centro da Terra. No sistema de coordenadas da 


Fig. 3.6.2 temos g = —gk e w = —w cos MM +wsen Ak, donde 


Zef =—(9— Rw? cos? À) k + Rw? sen À cos Ai. (3.6.11) 


Há, portanto, uma redução da aceleração da gravidade na direção vertical e o aparecimento 
de uma componente na direção norte-sul que faz com que Zef não aponte exatamente na 


direção vertical, isto é, para o centro da Terra. Os efeitos, todavia, são pequenos porque 


27 


o O ES o 107 —1 
Om esis ee 


e, consequentemente, 


Ru? = (6400km) x (7,3 x 10-8 s71)? ~ 3 x 10-2 m/s? , 
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que é cerca de 300 vezes menor do que a aceleração da gravidade. Este efeito centrífugo, 
embora diminuto, não pode ser desprezado nos estudos da forma da Terra ou do movimento 


de foguetes. 


Para objetos em movimento nas proximidades da superfície da Terra o último termo 
no lado direito da Eq.(3.6.7) é usualmente muito menor do que o termo correspondente 
à força de Coriolis. Essencialmente, o efeito centrífugo resume-se em converter g em gef» 
e a principal alteração no movimento induzida pela rotação da Terra provém da força 
de Coriolis. Para um avião supersônico com velocidade v = 2000km/h, a aceleração 
de Coriolis não é superior a 2wv = 0,08m/s”, ou cerca de 0,008g. Embora pequena, a 
aceleração de Coriolis é importante em muitas circunstâncias, como veremos em alguns 
exemplos que se seguirão. No hemisfério norte a força de Coriolis tende a defletir para 
a direita um objeto disparado paralelamente à superfície da Terra (horizontalmente), a 
deflexão sendo para a esquerda no hemisfério sul. Presume-se que este efeito explique o 
comportamento dos ciclones, que tipicamente giram no sentido anti-horário no hemisfério 


norte mas, no hemisfério sul, giram no sentido horário (Goldstein 1980). 
E Exemplo 3.6.1. Um objeto cai de uma altura h a partir do repouso. Determinar a deflexão 
transversal do objeto ao atingir o solo, provocada pela força de Coriolis. 


Solução. Se o objeto cai verticalmente, v = —vk com v > 0 e a força de Coriolis é 


Foo = 2mv x w = —2mvk x (—w cos Ai + wsen àk) = 2mwvcos rj . (3.6.12) 


O desvio, portanto, é no sentido oeste-leste. No hemisfério sul À < 0 mas o sentido da deflexão é 
o mesmo, pois cos(— À) = cos A. Na direção vertical a equação de movimento é aproximadamente 


1 
Z=-g z= —gt z h— sot’ , (3.6.13) 


com as condições iniciais 2(0) = 0, z(0) = h. Na direção oeste-leste temos 


y = 2wv cos A = Zwgtcos À . (3.6.14) 


2 


A rigor, só imediatamente após o início da queda o vetor velocidade v é vertical. À medida 
que cai, a partícula adquire uma velocidade transversal que permanece sempre muito menor do 
que a componente vertical porque a aceleração de Coriolis é muito menor do que a aceleração 
da gravidade. Isto justifica aproximar v apenas por sua componente vertical durante todo o 
movimento de queda livre, como fizemos na Eq. (3.6.14). Com as condiçõesiniciais y(0) = y(0) = 0 
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Figura 3.6.3: Pêndulo de Foucault 


resulta 


wg 


y= a cos À = 5 cos À . (3.6.15) 


Ao atingir o solo (z = 0), o deslocamento transversal é 


3 
Ay = =| | = cos À . (3.6.16) 


No equador, onde o efeito é máximo, para uma queda de uma altura h = 100m a deflexão 


Or 


Or 


Ay = 2,2cm. Apesar de o desvio ser mensurável a experiência é de difícil realização, pois 
preciso eliminar influências de ventos, resistência do ar, e outras que podem mascarar a deflexão 


de Coriolis. 


E Exemplo 3.6.2. (Pêndulo de Foucault) Desprezando o termo quadrático em w em (3.6.7) 
e tomando gor = g, a equação de movimento de um pêndulo simples torna-se, aproximadamente, 


ma=T+mg+2mv xw , (3.6.17) 


onde T denota a tensão no fio. É conveniente escolher a origem do sistema de coordenadas no 
ponto de equilíbrio do pêndulo (Fig. 3.6.3). No caso de pequenas oscilações, o deslocamento 
vertical do pêndulo é muito menor do que o deslocamento horizontal. De fato, 


02 
z = €(1 — cos 0) ~ ty ; 


de modo que 
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w 
o 


<1 


DIX 
NID 


para 0 pequeno. Portanto, na direção vertical o pêndulo permanece praticamente em repouso, a 
tensão no fio equilibrando o peso: 


Tcos 0x mg => T x mg (3.6.18) 


pois cos 0 ~ 1. A força de Coriolis é transversal ao plano de oscilação do pêndulo, o que faz com 
que o pêndulo não oscile num plano fixo. As componentes horizontais de (3.6.17) são 


T T 
ïţ = —— sen 0 cos ġ + 2w:y , y= —— senl send— 2w:t , (3.6.19) 
m m 
com 
wz =wsenÀ . (3.6.20) 
Mas 
seng = E , peoosg=x2 , psend=y, (3.6.21) 


de modo que, com o uso de (3.6.18), (3.6.19) assume a forma 


Gtuee=2w.y , Ytuey= Wye , (3.6.22) 
onde 
= ; (3.6.23) 


Note que, para um pêndulo típico com £ < 10m temos wọ > Is! >> w,. As equações de 
movimento do pêndulo resolvem-se mais facilmente com a ajuda da variável complexa ¢(t) = 
x(t) + iy(t), pois as equações (3.6.22) são as partes real e imaginária de 


C+2iw+ue6=0. (3.6.24) 


Esta última equação admite soluções da forma C(t) = (ge 'P! com 


—p* + Qwp + we = 0 p = w: E yw + wg ew, Ewo. (3.6.25) 
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A solução geral para ¢(t) é 


C(t) = Ae e a, Be tee font, (3.6.26) 


Adotando as condições iniciais x(0) = a, «(0) = 0, y(0) = y(0) = 0, de modo que o pêndulo 
começa oscilando no plano xz, obtém-se 


Ate. 4 De Cep A A=B=a/2, (3.6.27) 
Wo + Wz wo 
donde 
C(t) = acos wote “et. (3.6.28) 
Portanto, 
x(t) = Re C(t) = acos w, t cos wot , y(t) =Im¢(t) = —asenw,t cos wot . (3.6.29) 


O ângulo ọ que o plano de oscilação faz com o plano inicial de oscilação (plano zz) satisfaz 


tan p= - =-tanwt = p=-wit =—(wsendA)t. (3.6.30) 


O plano de oscilação gira com velocidade angular wsen À em torno da vertical, o sentido, visto 
de cima, sendo horário no hemisfério norte (A > 0) e anti-horário no hemisfério sul (A < 0). A 
cada 24 horas o plano de oscilação gira de 27 sen À. Na latitude do Rio de Janeiro (A = —22°54’) 
o plano de oscilação do pêndulo gira de 140º por dia no sentido anti-horário. No pólo norte a 
rotação é de 360º por dia e pode ser entendida da seguinte maneira: o plano de oscilação é fixo 
num referencial inercial, mas a Terra gira de 360º por dia no sentido anti-horário embaixo do 
pêndulo, de modo que para um observador na Terra o sentido de rotação do plano de oscilação 
é horário. Como observação final, note que (3.6.29) mostra que a ordem de grandeza de ¢ e y é 


wo a porque wo >> w > wz. Por outro lado, a ordem de grandeza de |w x (r x w)| é w?a. Portanto, 


a razão entre o termo centrífugo e o termo de Coriolis em (3.6.7) é w2a/2wgaw = w/2wo <1, 0 


que justifica a posteriori a aproximação feita ao se escrever (3.6.17). E 
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PROBLEMAS 


3.1. Em três dimensões existe uma correspondência biunivoca entre vetores e matrizes 
anti-simétricas reais, como, por exemplo, aquela estabelecida pela Eq.(3.4.11). (i) Prove 
e que os autovalores da matriz anti-simétrica associada ao vetor n são zero e +i|n|. (ii) 
Se A é uma matriz real anti-simétrica, prove que as matrizes I + A são não-singulares 
e que a matriz B = (I+ A)(I — A)! é ortogonal. 


3.2. Exprima o vetor r’ obtido por reflexão do vetor r em relação a um plano cujo vetor 
unitário normal é n. Sem efetuar nenhum cálculo, usando apenas argumentos geométricos, 
determine os autovalores e autovetores da matriz de transformação correspondente A. Se 
nh = (m,no,ns), mostre que A tem elementos A;; = d;;—2n;n; e é uma matriz ortogonal 


imprópria. 


3.3. Para a matriz D da Eq.(3.3.1), prove que 


cos ny senno 0 
D” = | —sennd cosny O 
0 0 1 


3.4. Uma esfera de raio R rola sem deslizar sobre uma superficie plana. Se (x,y, R) 
são as coordenadas do centro da esfera, mostre que, em termos dos ângulos de Euler, as 


condições de rolamento sem deslizamento são 


i— R(Ê send—w send cos ¢)=0 , y+ R(O cos b +) send send) = 0 


e prove que esses vínculos não são holônomos. 


3.6. A derivada de uma matriz é constituída pelas derivadas de seus elementos. (1) 
Se A é uma matriz ortogonal dependente do tempo, prove, tomando como ponto de 
partida a identidade AA’ = ATA = I , que a matriz A’dA/dt é anti-simétrica. (ii) 
Se ro é um vetor fixo num corpo rígido em rotação e r(t) é o mesmo vetor visto de 


um referencial inercial, a relação entre as componentes correspondentes, em linguagem 
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matricial, é r(t) = A(t) rọ. Pelo item anterior, e levando em conta o Problema 3.1, prove 


que existe um vetor w tal que, para o observador inercial, dr/dt =w xr. 


3.6. Qualquer matriz ortogonal própria A corresponde a uma rotação de um certo ângulo 
® em torno de uma certa direção. O eixo de rotação é determinado pelo autovetor de A 
com autovalor 1. Se escolhermos as coordenadas de tal modo que o eixo z coincida com 
o referido autovetor, a matriz A terá a forma (3.3.1). Considerando que o traço de uma 
matriz é independente do sistema de coordenadas, prove que o ângulo de rotação é dado 
por cos® = (tr A — 1)/2. 


3.7. O deslocamento linear de um corpo pode ser representado por um vetor, e a ve- 
locidade linear é a derivada do vetor posição em relação ao tempo. O vetor velocidade 
angular, no entanto, não é, em geral, a derivada temporal de um vetor deslocamento an- 
gular. Para provar isso, suponha que exista um vetor cujas componentes A,, Ay, A, sejam 
funções dos ângulos de Euler tais que as respectivas derivadas temporais coincidam com 


as componentes correspondentes da velocidade angular, isto é, 


Bilis «Ohio OKs Ay, Ag, AAy u, = Meg, OAs g | OMe 5 
| E 8 | 


a 
We ap POR ob PU DO Oe Ob E Oe ae Oe © 


Usando (3.4.31), prove que não existe nenhum vetor (A,, Ay, A.) que satisfaça as equações 


acima. 


3.8. Seja P uma matriz de rotação de 180º em torno de um eixo arbitrário. (ii) Determine 
P? sem cálculos, refletindo sobre o seu significado. (ii) Sendo A = (I + P)/2 e B= 
(I — P)/2, prove que A? = A e B? = B. (iii) Mostre que as matrizes A e B são 


singulares e calcule o seu produto. 


3.9. Um projétil é disparado horizontalmente nas imediações da superfície da Terra. 
Qual é a direção (para cima, para baixo, para a direita, para a esquerda, para a frente ou 
para trás) do desvio induzido na trajetória pela força de Coriolis? A direção do desvio é 


diferente nos hemisférios norte e sul? A intensidade do efeito depende da latitude? 


3.10. Uma partícula é disparada verticalmente com velocidade inicial vo, atinge uma 


altura máxima e retorna ao solo. Mostre que a deflexão provocada pela força de Coriolis, 
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quando ela atinge novamente o chão, tem sentido oposto e é quatro vezes maior do que o 


desvio produzido quando a partícula é largada em repouso da mesma altura máxima. 


3.11. Já se sugeriu que os pássaros podem determinar sua latitude pela força de Coriolis. 
Calcule a força que um pássaro em vôo horizontal a 50km/h deve exercer contra a força 
transversal de Coriolis para voar em linha reta. Exprima o resultado em função do peso 


do pássaro e da latitude. 


Capitulo 4 


DINÂMICA DO CORPO RÍGIDO 


Roda mundo, roda-gigante 
Roda moinho, roda pião 

O tempo rodou num instante 
Nas voltas do meu coração. 


Chico Buarque, Roda Viva 


Agora que estamos de posse dos instrumentos cinemáticos necessários, podemos pro- 
ceder ao exame de alguns problemas simples mas importantes da dinâmica do corpo rígido, 
o que exige levar em conta as causas do movimento: forças e torques. Duas grandezas 
físicas essenciais ao estudo do movimento de um corpo rígido são o momento angular e a 


energia cinética, que passamos a considerar em detalhe. 


4.1 Momento Angular e Tensor de Inércia 
As equações de movimento de um corpo rígido podem ser escritas na forma 


dP 


uF. (4.1.1) 
dL 

— = 4.1.2 
EN, (4.1.2) 


onde F é a força resultante e N é o torque total, ao passo que P e L são o momento linear 
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Figura 4.1.1: O ponto O é um ponto fixo do corpo ou o seu centro de massa. 


total e o momento angular total, respectivamente. Como vimos na Seção 1.1, as equações 
(4.1.1) e (4.1.2) são verdadeiras somente se as taxas de variação temporal são relativas a 
um referencial inercial e se são obedecidas certas restrições quanto ao ponto em relação 
ao qual o torque e o momento angular são calculados. Em particular, (4.1.2) vigora se o 
ponto de referência para o cálculo de N e L é um ponto imóvel (conveniente no caso em 
que o corpo rígido está limitado a girar em torno de um ponto fixo) ou é o centro de massa 


do corpo. 


Seja O um ponto fixo ou o centro de massa de um corpo rígido. Do ponto de vista do 
sistema de referência inercial X (Fig. 4.1.1), o momento angular total do corpo em relação 


ao ponto O é 


N 


N 
L= Sore X Pr =Y mere X Vp, (4.1.3) 
k=1 k=1 


onde N é o número de partículas do corpo e vp = (dr;/dt)s é a velocidade da k-ésima 
partícula em relação ao ponto O, do ponto de vista do sistema inercial 3 . Mas rz, é um 


vetor constante relativamente a um sistema cartesiano X’ fixo no corpo, donde 


dr 
Vk = (St) - (St) + wW Xrk = WXrk. (4.1.4) 


Com este último resultado nos é permitido escrever 
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N 


L = XO Merg X (wW X rp) = 
k=1 k 


melriw— (rk-w)rk], (4.1.5) 


Mz 


1 


onde usamos a identidade ax (b xc) = (a-c)b—(a-b)c. Neste estágio torna-se conveniente 


adotar uma notação indicial para as componentes de rz, isto é, rẹ = (sP 2) rP), 


(k) — (k) — (k) — 


que corresponde, na notação tradicional, a x} = £k, ©, = Yk, T3 Zp. Escrevendo 


L = (Lı, Lz, L3), a i-ésima componente de (4.1.5) é dada por 


L=¢ mer?) wi — DS mae wo = SD mg [12 65; al gh lw;, (4.1.6) 
k=1 k=1 j=1 k=1 j=1 
já que 
be 3 
rev =D xl Wj : wi => bij w; : (4.1.7) 
j=1 j=1 
Conseguentemente, 
j=1 
onde 
a k) (k) 
Tig = DD mlp gan e | (4.1.8) 
k=1 


As nove quantidades [;;, i, j = 1,2,3, são chamadas de componentes do tensor de inércia. 


Na maior parte dos problemas envolvendo corpos rígidos é mais prático tratá-los como 
corpos contínuos do que como sistemas discretos de partículas. A transição da repre- 


sentação discreta para a contínua faz-se mediante a correspondência 


N 
rk — r à Sm — f p. (4.1.9) 
k=1 V 


Em outras palavras, a massa puntiforme my na posição rẹ é substituída pelo elemento de 
massa dm = pdv localizado no ponto r, e a soma sobre todas as partículas é substituída 
por uma integração ao longo do volume V ocupado pelo corpo. A versão contínua de 
(4.1.8) é, portanto, 


i =i [r? Oj — did; lpdv . (4.1.10) 
V 
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Uma representação intrínseca do tensor de inércia que remove qualquer referência a 
um sistema de coordenadas particular é obtida notando que a equação (4.1.5) pode ser 


escrita na forma simbólica 


N N 
L=(S meri)o-(S merere) w, (4.1.11) 
k=1 k=1 


onde a segunda soma envolve um produto tensorial ou produto diádico de vetores, cujo 


significado e propriedades passamos a discutir. 


4.2 Interlidio Matemático: Tensores e Diádicas 


O produto diádico ou produto tensorial de dois vetores A e B, denotado simplesmente! 
por AB, é um operador linear que transforma vetores em vetores. O operador AB é 
também chamado de uma díada, e o resultado de sua ação sobre um vetor qualquer C 
define-se por 

(AB)-C=A(B-C). (4.2.1) 


Como B-C é um escalar, o lado direito de (4.2.1) é o produto de um escalar por um vetor, 


ou seja, é de fato um vetor. A linearidade é uma decorrência imediata desta definição : 


(i) (AB) - (aC + 6D) = (AB).C+A(AB)-D , a 8 EIR. (4.2.2) 


Por definição valem as seguintes propriedades adicionais: 


(ii) (AB + CD) - E = (AB) -E + (CD) -E ; 


(iii) (A +B)C = AC +BC ; (4.2.3) 


(iv) A(B+C)=AB+AC. 


'O produto diádico é representado pela mera justaposição de dois vetores, sem indicação de produto 
escalar nem de produto vetorial. 
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O produto tensorial é distributivo em relação à adição vetorial, mas nao é comutativo, 
isto é, AB Z BA em geral. Também é possível definir o produto escalar de um vetor por 


uma díada pela esquerda: 


C-(AB)=(C-A)B. (4.2.4) 


Por este motivo, uma notação bastante sugestiva para uma diada é uma letra encimada 


por uma seta dupla, assim: T= AB. 


O tensor? ou a diádica mais geral possível é uma soma de díadas: 


T=AB+CD+---. (4.2.5) 


Decompondo os vetores A,B,C,D,... em termos dos vetores unitários de uma base 


É me À 
ortonormal {ê;, ê2, êg} verificamos que o tensor mais geral T escreve-se 


Ss 
T= 7116141 + 1,66 + Tis êi êz + 


To) €2 ê1 + 1526, €2 + Toa é €3 + 


Ta ese, + To e3 €2 + T33 €3 €3 , (4.2.6) 
~ 2 . ford 
onde T1, ..., T33 são nove números reais, chamados de componentes do tensor T na base 
em questão. Claramente, 
A SE A 


não havendo necessidade de parênteses nesta última equação porque A - (T BJ=(A- T) -B 


(verifique!). 


O tensor unidade ou identidade, simbolizado por 1 , é definido por 


2Tendo em vista que neste capítulo não necessitaremos de tensores de ordem superior, sempre que não 
houver perigo de confusão usaremos simplesmente “tensor” para nos referirmos a um tensor de segunda 
ordem (vide o penúltimo parágrafo desta seção) . 
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1= é êi + êv é + ês ês E (4.2.8) 


Dado um vetor arbitrário A = A,é; + Á2ê2 + Asês temos 


1.A-=ê(8-A) + ê(ê2- A) + es(63- A) = A,6 + Á ê + 4565 = A 


com idêntico resultado para A- 1, o que justifica o nome dado a 1. Evidentemente, as 


componentes de 1 na base ortonormal (ê,, êz, êg} são 


como era de se esperar. E fácil demonstrar que, projetada em componentes na base 


(és, a equação 


A=T.B (4.2.9a) 
equivale a 
A => TB; . (4.2.9b) 
j=1 


donde 


que corresponde à Eq.(4.2.9b). 
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O produto vetorial pela esquerda de um vetor A por um tensor T 6 um outro tensor 


A xT definido de modo natural por sua ação sobre um vetor arbitrário B: 


(AxT)-B=Ax(T-B). (4.2.10) 


E Exercício 4.2.1. Defina o produto vetorial pela direita do vetor A por uma díada e, por 


linearidade, estenda a definição a uma diádica qualquer T. Mostre que vale a fórmula 
(TxA)-B=T(AxB) (4.2.11) 


para um vetor arbitrário B. a 
E Exemplo 4.2.1. Com o emprego de diádicas, exprima o operador de rotação numa forma 
intrínseca, independente de qualquer sistema de coordenadas. 

Solução. Considere o vetor r’ produzido por uma rotação de um ângulo a do vetor r em 


torno da direção definida pelo vetor unitário n, conforme a Fig. 4.2.1. Vamos construir uma 
base ortonormal {ê1, €2, 63}, indicada na Fig. 4.2.1, tomando ê3 ao longo do eixo de rotação, 


&=à, (4.2.12) 


e escolhendo ê de modo que o vetor r pertença ao plano definido por ê e êz, sendo êz perpen- 
dicular a este plano (Pearlman 1967). Claramente, 


êz xr nxr 
EE OE , (4.2.13) 
lês xr) r seng 
onde 8 é o ângulo entre r e o eixo de rotação. Além disso, 
i ee n x (r x ñ) 
e] = €2 X €3 = (4.2.14) 
r sen 8 
As componentes x4, 75, 75 de r’ na base {€1, €2, 63} são 
x, =r’ sen 8 cos a = r sen cosa , (4.2.15a) 
ry =r’ sen? sena = r sen sena , (4.2.15b) 


x3 = r' cos 8 =r cos  , (4.2.15c) 
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Figura 4.2.1: Rotação finita de um vetor. 


onde usamos 7’ = r. Portanto, 


r= r} ê + xh êz +7563 =cosan x (rx Â) + senanxr+(r-n)n. (4.2.16) 


A identidade n x (r x ñ) = r — (r - ñ) Â nos permite escrever a fórmula de rotação 


r' = cos ar + (1 — cos a) Â (ñ - r) + senanxr . (4.2.17) 


Introduzindo o operador de rotação R, (a) definido por 


R, (a) =cosal +(1—cosa)an+senan xl, (4.2.19) 


a fórmula de rotação (4.2.17) pode ser sintetizada em 
r'=R,(a) r. (4.2.20) 


A expressão (4.2.19) é uma representação intrínseca do operador de rotação que só faz referência 
ao eixo de rotação (ñ) e ao ângulo de rotação (a), sem aludir a nenhum sistema de coordenadas 
particular. Essa representação é consideravelmente vantajosa em diversas situações de interesse 


físico (Leubner 1979). E 


E Exercício 4.2.1. Se a = 50 é um ângulo infinitesimal, prove que (4.2.17) reproduz a 


equação (2.5.10). E 
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É importante determinar a lei de transformação das componentes de uma diádica sob 


uma rotação dos eixos coordenados. Pela Eq.(3.1.16) temos 


Tres êl. T -êl = OD Arkêk)- T DD asi€1) = 5 Ark Th - (4.2.21) 
k l k,l 


Um tensor de ordem n ou de n-ésima ordem é definido como um conjunto de 3” quantidades 


Tki ky... km qUe se transformam sob uma rotação dos eixos coordenados segundo a lei 


/ 
EE. DE Ap aee ada (4.2.22) 


l1, l2,- ln 


Portanto, uma diádica é um tensor de segunda ordem. Um vetor é um tensor de primeira 


ordem e um escalar pode ser considerado um tensor de ordem zero. 


Em termos das matrizes T” = (T’,;), T = (T,.) e da matriz de rotação A, a Eq.(4.2.21) 


é equivalente a 


T'i =X (Ae D Tu A’) = SUA (TA ps = (AT AY js 


k k 


isto é, 


Tie AT AS. (4.2.23) 


++ 
Portanto, a matriz associada ao tensor T na base {é/}3_, é obtida a partir da matriz 


dee À 
associado ao tensor T na base {€;}3_, por meio de uma transformação de similaridade 


executada pela matriz de rotação A que leva a base {ê;} na base {ê;}. 


—> 


E Exercício 4.2.2. Prove que em qualquer base ortonormal o tensor unidade 1 é represen- 


tado pela matriz identidade. E 
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4.3 Momentos e Produtos de Inércia 


Em notação diádica, a Eq.(4.1.11) escreve-se 


L= me (rg 1 —rer;)-w =] WwW. (4.3.1) 


onde 


[= Ym (r? ee rr Lp) (4.3.2) 
k 


é o tensor de inércia, cuja versão continua é 


Lae 1 —rr)pdo. (4.3.3) 
V 


As componentes do tensor de inércia na base {ê;}}; são dadas pela Eq.(4.1.10), da qual 


é evidente que o tensor de inércia é simétrico, isto é, 


Eds (4.3.4) 


esta propriedade sendo válida em qualquer base. A matriz cujos elementos são as compo- 
nentes do tensor de inércia relativamente a um dado sistema de coordenadas cartesianas 
é conhecida como matriz de inércia, denotada por I. Os elementos da diagonal da matriz 


de inércia I = (1;;) são chamados de momentos de inércia: 


ly = tee = Le — x°) pdv = Jo +2) pdv ; (4.3.5a) 
I = Ly, = Le —y’) pdv = L@ + 2”) pd ; (4.3.5b) 
Is = l; = fr — 2) pdv = Jæ +y)pdo . (4.3.5c) 


E Exercício 4.3.1. Mostre que cada momento de inércia nunca é maior do que a soma dos 


outros dois. = 
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Os elementos de fora da diagonal da matriz de inércia sao chamados de produtos de 


inércia e são dados por: 


ho = Ia = Ley = Tye = -f xy pdv ; (4.3.6a) 
V 

ig= el. == -f rzpdv : (4.3.6b) 
V 

misses -f yzpdo . (4.3.6c) 
V 


E importante sublinhar que os momentos e produtos de inércia dependem não apenas 


das direções dos eixos coordenados escolhidos, mas também de sua origem. 


4.4 Energia Cinética e Teorema dos Eixos Paralelos 


A energia cinética de rotação em torno do ponto O (Fig. 4.1.1) é dada por 


m m m 1 1 
TSN DD Eve (w xr) =) o (te X v) = GW ote X Pe wL 
k k k 


P 3 

(4.4.1) 
Com o emprego da Eq. (4.3.1) podemos escrever 
liso 

= z” Iw. (4.4.2) 


Seja à o unitário ao longo do eixo instantâneo de rotação, de modo que w = wn. Então, 


Tw? , (4.4.3) 


onde 


T=a-1-a (4.4.4) 
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Figura 4.4.1: O ponto O é um ponto fixo do corpo ou o seu centro de massa. 


é chamado de momento de inércia em relação ao eixo de rotação. Mais explicitamente, 


com o uso de (4.3.2), 


T=a- I a= So mir? - À- r)? = 5 mada (4.4.5) 
k k 


onde 


d = r? — (ñ rz)? = r? (1 — cos? 0p) = r? sen? 6, = (À x rz)” (4.4.6) 


é o quadrado da distância da k-ésima partícula ao eixo de rotação (Fig. 4.4.1) A expressão 
(4.4.5) coincide com a definição de momento de inércia encontrada nos textos de física 
elementar. Da mesma forma, (4.4.3) é a fórmula usual para a energia cinética de rotação 
de um corpo rígido. Em geral, no entanto, a velocidade angular muda de direção com o 
passar do tempo, de modo que J varia com o tempo. O momento de inércia J é constante 
se o corpo estiver limitado a girar em torno de um eixo fixo, caso normalmente tratado na 


física elementar. 


O momento de inércia depende da escolha da origem do sistema de coordenadas ado- 
tado para calculá-lo. Há, todavia, uma relação simples entre momentos de inércia relativos 


a eixos paralelos quando um deles passa eelo centro de massa. 
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Figura 4.4.2: Teorema dos eixos paralelos. 


Teorema dos Eixos Paralelos.” O momento de inércia em relação a um dado eixo 
é igual ao momento de inércia relativo a um eixo paralelo passando pelo centro de massa 
acrescido do momento de inércia do corpo em relação ao eixo original, calculado como se 


o corpo estivesse inteiramente concentrado no centro de massa. 


Demonstração. Da Fig. 4.4.2 infere-se r, = R + ri, onde R é o vetor posição do 
k 


centro de massa a contar da origem O. O momento de inércia em relação ao eixo a é, por 


(4.4.5) e (4.4.6), 


l= > mix) => mx R +À x r) = 
k k 


= (> m,)(a x R? + > mÀ x r) + 2(8 x R)-( x SO mary). (4.4.7) 


Com o emprego da Eq.(1.1.18) esta última equação reduz-se a 


Ig=h+M(axR)? , (4.4.8) 


completando a demonstração do teorema, pois (ñ x R)? vem a ser o quadrado da distância 


do centro de massa ao eixo original a. 


O próprio tensor de inércia admite uma decomposição análoga à (4.4.8). De fato, 
substituindo rą = R + rj, em (4.3.2), e utilizando as propriedades do produto tensorial, 


resulta 


3Também conhecido como teorema de Steiner. 
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T,= 7 mal(ri2 + 2R-r, + R?) 1 -(R+r,,)(R + r’) 


isto é, 
To = Toy + M(F? 1 -RR) . (4.4.9) 


Note que o segundo termo é o tensor de inércia, relativo à origem O, do corpo rígido como 


se toda a sua massa estivesse concentrada no centro de massa. 


E Exercício 4.4.1. Deduza (4.4.8) tomando (4.4.9) como ponto de partida. E 


Teorema do Eixo Perpendicular. Dada uma placa plana de formato e distribuição 
de massa arbitrários, a soma de seus momentos de inércia em relação a quaisquer dois eixos 
perpendiculares contidos no plano da placa é igual ao momento de inércia relativamente 


a um eixo que passa por seu ponto de interseção e é perpendicular à placa. 


E Exercício 4.4.2. Demonstre o teorema do eixo perpendicular . E 


4.5  Diagonalização do Tensor de Inércia 


As componentes do tensor de inércia dependem da origem e da orientação dos eixos co- 
ordenados relativamente ao corpo rígido. Uma vez fixada uma origem, seria extremamente 
conveniente se fosse possível encontrar eixos coordenados €1, 2,3 com vetores unitários 
É 1&5, Es relativamente aos quais o tensor de inércia assumisse a forma diagonal. Nesse 
caso teríamos 


T= 1,6, ê + hê ê + Iê ê (4.5.1) 
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donde 
L= Tw = lwi é, + Tow Ê + Iw ê (4.5.2) 


isto é, 
Lı = lhw a Lo = Tow 5 Ls = T3003 à (4.5.3) 


Analogamente, a energia cinética tomaria a forma particularmente simples 


1 1 


O tensor de inércia é um operador linear real e simétrico, logo auto-adjunto, e o 

Teorema C.13 do Apêndice C assegura a existência de uma base ortonormal constituída 
+=+ 

por autovetores de IJ. Em outras palavras, existem três números reais 14, 15,1; e três 


vetores unitários e mutuamente ortogonais É 1> Ê, i É 3 tais que 
Têj=hê , T&=hé , Iê = hê, (4.5.5) 
ou, em forma abreviada, 
Lê=Iê,, j=1,2,83. (4.5.6) 


A A A => 
Escolhendo os eixos cartesianos ao longo dos vetores €, , € , £ as componentes de T nesta 


base são dadas por 


A A 


lj = EI, =I; E, = lj ðij , (4.5.7) 


de modo que a matriz de inércia nesta base é diagonal: 


I=(L)=| 0 bh 0]. (4.5.8) 
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Os elementos da diagonal 1, I2, [3 são chamados de momentos principais de inércia, e 


os eixos cartesianos correspondentes são chamados de eixos principais de inércia. 


A determinação dos eixos principais de inércia equivale à resolução da equação para É 


bea do; (4.5.9) 


com € #0 e I €JR Encontradas três soluções mutuamente ortogonais ficam definidos os 
eixos principais de inércia, os valores correspondentes de J sendo os momentos principais de 
inércia. Com uma escolha inicial arbitrária dos eixos coordenados, a Eq.(4.5.9) escreve-se, 


em componentes, 


j 
ou, matricialmente, 
beat ho hs E 
Íz Ds — Í 193 Êz =0. (4.5.11) 
Ia T39 Is3— 1I és 


Este sistema de equações lineares para as componentes de € só tem solução não trivial se 


lu — IT ho hs 
det Íz 15 — I Ds — 0. (4.5.12) 
Ig Tp I33 -I 


Esta última equação é cúbica em J, e suas três raízes são os momentos principais de inércia. 
Para cada raiz, a Eq.(4.5.11) pode ser resolvida para as componentes de €, fornecendo, 


assim, a direção do eixo principal de inércia correspondente. 


E Exemplo 4.5.1. Dada uma placa homogênea na forma de um triângulo retângulo isósceles, 
determinar os eixos principais de inércia em relação ao vértice oposto à hipotenusa. 


Solução. Adotamos inicialmente o sistema de eixos indicado na Fig. 4.5.1(a). Se M éa 
massa da placa, sua densidade superficial de massa é 


M 2M 


“Pp 


144 CAPÍTULO 4. DINÂMICA DO CORPO RÍGIDO 


O tensor de inércia tem as seguintes componentes: 


a pay M 
In = lsz = o fy + 2°) da = o | f y dzdy = o : 
o Jo 


2 
(por simetria) ; 


M 
To» = Lyy =o | + 22)da = h = 


M 
B=) = Irz + Iyy = a (pelo teorema do eixo perpendicular) ; 


a pa-y M 2 
ho = Iry = -o f zyda = -o | / eydady = -= ; 
0 Jo 12 


hs = In = 0 | zzda=0 ; Is = I = —0 | yzda=0 . 


Portanto, 


2 

Ma? 
PS) = aes | -1 
0 


—1 
12 E 
0 


Roo 


Pondo I = Ma?X/12, precisamos encontrar as raízes da equação 


As raízes são À = 1, A2 = 3, A3 = 4, de modo que os momentos principais de inércia são 


O autovetor com autovalor J; satisfaz 


2— à . AI 0 E f1—-&2 =0 
—1 2—A, 0 E2 =0 = —-§ +&=0 
0 0 4— A &3 3&3 = 0 
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Figura 4.5.1: Eixos originalmente escolhidos e eixos principais de inércia de uma placa 
plana triangular em relação ao vértice oposto à hipotenusa. 


Conseqtientemente, 


il 1 E y 
é& |=a] 1 ou €=a(i+j) , 
E3 0 


onde a é um número real arbitrário. Escolhendo-se a = 1/v2 resulta um vetor normalizado 
(unitário) ê. Este vetor, que pertence ao plano ry e faz um ângulo de 45° com o eixo x, fornece 
a direção do primeiro eixo principal de inércia. Repetindo o procedimento obtém-se o segundo 
eixo principal de inércia ao longo do vetor E> = 9-1/ ER + j), e o terceiro ao longo do vetor 


£3 =k, isto é, coincidente com o eixo z (Fig. 4.5.1(b)). E 


E Exemplo 4.5.2. Usando a equação (4.4.9), mostre que os eixos 1,2,3 da Fig. 4.4.1(b) 
também são eixos principais de inércia em relação ao centro de massa da placa e determine os 
momentos principais de inércia correspondentes. 


Solução. O vetor posição do centro de massa a contar da origem O é R = (av2/3)é,, 
donde, por (4.4.9), 


PR o > NER a a: Ma? ~ » PORN PUEN a da 
Tow = Lo — M(R? 1 -RR) = Bê £ + DEE + I3€3€3 — bes + €5€o + €3€3 — 8181) 


RÃ Ma? a a M 
= hê,ĝ, + (o — babe + (o À 


ap: 
Logo, I,,, também é diagonal relativamente aos eixos 1,2,3 com origem no centro de massa e 
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2 2 2 
IM = a IgM Ma 7M Ma 
1 = , 2 , 3 J 
12 36 9 
são os momentos principais de inércia correspondentes. E 


4.6 Simetrias e Eixos Principais de Inércia 


A identificação dos eixos principais de inércia é grandemente facilitada se o corpo é 
simétrico. Dizemos que um corpo rígido possui um plano de simetria se existe um plano 
que divide o corpo em duas porções de tal modo que uma seja a imagem especular da 
outra relativamente ao referido plano. Em particular, a densidade de massa do corpo deve 


ser a mesma em pontos simetricamente situados em relação ao plano de simetria. 


Lema 4.6.1. Se um corpo tem um plano de simetria, um eixo principal de inércia é 


perpendicular a esse plano. 


Demonstração. Seja xy o plano de simetria, de modo que p(z, y, —z) = plz, y, z). 


Conseqüentemente, 


Lin - | | fazo(a,y, z)dzdydz =) (4.6.1) 


porque o integrando é uma função ímpar de z e o intervalo de integração é simétrico em 


relação a z = 0. Argumento análogo aplica-se a yz, de modo que 


Iss Isy O 
LS" toe. dy 0 s (4.6.2) 
0 0 l; 
que claramente possui o autovetor 
&1 0 ; 
& |= | 0 , ou ç Ẹ=k (4.6.3) 
63 1 


com autovalor I,,. 
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Diz-se que um corpo possui um eixo de simetria se ele é uma figura de revolução em 
torno do referido eixo e a distribuição de massa depende exclusivamente da distância ao 


eixo. 


Lema 4.6.2. Um eixo de simetria de um corpo rígido é um eixo principal de inércia. 
Quaisquer dois eixos mutuamente ortogonais contidos num plano perpendicular ao eixo de 
simetria são eixos principais de inércia, e os momentos principais de inércia correspondentes 


são iguais entre si. 


E Exercício 4.6.1. Demonstre o Lema 4.6.2. Sugestão: considere dois planos perpendicu- 


lares cuja interseção é o eixo de simetria e aplique o Lema 4.6.1 a cada um deles. Et 


Um reexame do Exemplo 4.5.1 à luz dos lemas anteriores revela que os eixos principais 
de inércia da placa triangular poderiam ter sido identificados sem cálculos. O eixo z é 
perpendicular ao plano da placa (Fig. 4.5.1), que obviamente é um plano de simetria. 
Portanto, o Lema 4.6.1 garante que o eixo z é um eixo principal de inércia. Claramente, 
um plano perpendicular à placa que passa pela origem O e é ortogonal à hipotenusa é 
também um plano de simetria, de modo que, novamente pelo Lema 4.6.1, o eixo 2 é um 
eixo principal de inércia. Finalmente, o terceiro eixo é simplesmente perpendicular aos 


outros dois, e identificamos o eixo 1 como o último eixo principal de inércia da placa. 


E Exemplo 4.6.1. Determinar os eixos principais de inércia de um cubo homeogéneo, de 
massa M e aresta a, em relação a um dos vértices. 


Solução. Escolhamos os eixos iniciais conforme indicado na Fig. 4.6.1. Por simetria, os 
momentos de inércia são iguais entre si, o mesmo acontecendo com os produtos de inércia: 


e ar ere 2.5. 24,2 
D= vy = Tae = [ I fo + z“)pdzdydz = z pa = Ma ; 
Ma? 


a a a 1 5 
Izz = Iyz = Iry = -j f A cypdrdydz = ype = 7 


Assim, a matriz de inércia é dada por 


À. SBB -5/8 
=3/8:: a. 28/84. (4.6.4) 
-3/8 —3/8 1 


_ 2Ma? 
8 


I 
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Figura 4.6.1: Planos de simetria de um cubo homogêneo em relação a um vértice. 


Por inspeção da Fig. 4.6.1 identificamos os planos de simetria OABCO e ODBEO, cujos 
vetores unitários normais são, respectivamente, 


OC OA & Doe i ~ OD OE ;, (+k) 1 œ, 
x = H NIS » Mm = x = 1X = (k—j) . 

V2a a V2 V2 a v2a V2 V2 

Note que os vetores hj e fio são linearmente independentes mas não são ortogonais. Isto é 

possível porque a matriz de inércia tem autovalores degenerados (vide Apêndice C), isto é, dois 

dos momentos principais de inércia são iguais. De fato, de 


nı = 


l aa 1 1 l aa 0 0 

a la -1 |=(1-a)] -1 ; a la -1 |}=(1-a)] -1 r 

aa 1 0 0 aa il 1 
com a = —3/8 deduz-se que I, = Iz = 11Ma?/12. Autovetores mutuamente ortogonais e 
normalizados podem ser obtidos fazendo, por exemplo, É, = ıı € Ê, = a(n; + Bio), com os 
números reais œ e 2 escolhidos de tal modo que €,:&, = 0 e lê] = 1. Um cálculo elementar 


fornece £, = (î+j—2k)/v6. O vetor ao longo do terceiro eixo principal de inércia é simplesmente 


& =ê x & = ED y SE L G++), 


cuja direção coincide com a da diagonal OB do cubo. Finalmente, de 


| 2398 =3/8 1 1 

1 
-3/8 1 -3/8 MEIE 
-3/8 =8/8 1 1 1 


conclui-se que o terceiro momento principal de inércia é [3 = Ma? /6. E 
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Figura 4.7.1: Moeda rolando sem deslizar ao longo de um plano inclinado fixo. 


4.7 Moeda Rolante 


Mesmo os problemas tridimensionais mais simples da dinâmica dos corpos rígidos já 
são consideravelmente complicados. No outro extremo situam-se os problemas elementares 
de rotação em torno de um eixo fixo. Há problemas interessantes com apenas dois graus de 
liberdade rotacionais, os quais caracterizam-se por um grau de dificuldade intermediário 
e fornecem ilustrações bastante ricas e instrutivas dos conceitos e técnicas empregados na 


investigação do movimento dos corpos rígidos. 


Consideremos, por exemplo, uma moeda de massa m eraio R que cai ao longo de uma 
mesa inclinada rolando sem deslizar e sem tombar — o seu plano permanece perpendicular 
à mesa. Os eixos principais de inércia fixos na moeda e passando pelo centro de massa são 
quaisquer dois eixos mutuamente ortogonais contidos no plano da moeda, com o terceiro 


eixo perpendicular ao plano da moeda. Um cálculo elementar fornece 1; = mR?/2 e, 


por simetria e pelo teorema do eixo perpendicular, 1, = Ip = [3/2 = mR?/4. A energia 
cinética da moeda é a energia de translação do centro de massa acrescida da energia de 


rotação em torno do centro de massa, de modo que a lagrangiana do sistema escreve-se 


1 
L=T-V = (é? Y’) 4 zwi + wi + Iw?) + mgysena , (4.7.1a) 
onde a é a inclinação da mesa e x,y são coordenadas cartesianas do centro da moeda. 
Sejam & e 0 ângulos que descrevem rotações da moeda em torno do seu eixo de sime- 


tria e de um eixo perpendicular à mesa, respectivamente, como indicado na Fig. 4.7.1. 
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Conseqiientemente, w3 = ¢ e, levando em conta que 6 é o módulo da projeção do vetor 
velocidade angular sobre o plano da moeda, w? + w? = 62. Assim, a lagrangiana do 


sistema toma a forma 


R?. R?. 
L= M (a? ty") 4 z p- TA Zy mgysena . (4.7. 1b) 
2 4 8 
Os vinculos de rolamento escrevem-se 
i— Róseng =0 , (4.7.2a) 
y— Rócos 6 =0. (4.7.2b) 


Lançando mão do método dos multiplicadores de Lagrange, encontramos as equações 


de movimento 


mi =, , (4.7.34) 
my — mgsena = À», (4.7.3b) 
2 oe 
LE ee (4.7.30) 
4 
mR? .. 
5 4 = —àıRsen 0 — A2Rcosé , (4.7.3d) 


onde Ay, À» são os multiplicadores de Lagrange associados aos dois vínculos não-holônomos 
(4.7.2). 


E Exercício 4.7.1. Deduza as equações (4.7.3). E 
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De (4.7.3c) resulta imediatamente 


=O +t , (4.7.4) 


onde ĝo e Q são constantes arbitrárias. Combinando as Egs.(4.7.2a) e (4.7.3a) obtém-se 


M = mRósen6 + mROGcos0 , (4.7.5) 


e, procedendo analogamente, 


À» = mRócos6 — mRQG seno — mgsena . (4.7.6) 


A substituição dessas expressões para A; e A» em (4.7.3d) conduz à seguinte equação 


diferencial para q: 


-~  2Qgsena 
pa 


cos(0, + Qt) . (4.7.7) 


A solução geral desta equação é 


2g sen a 
302R 


cos(do + Qt) . (4.7.8) 


Finalmente, levando as Eqs.(4.7.4) e (4.7.8) nas equações de vínculo (4.7.2) e integrando 


resultam 
_ gsena wR | gsena 
z= to + "30 t= | o tao SM (do + a) cos(do + Qt) , (4.7.9) 
_ {wh | gsena Q Q 
Y = Yo Q j 302 sen (do + t) sen (do + t) E (4.7.10) 


Isto completa a integração das equações de movimento da moeda rolante em termos das 


seis constantes arbitrárias £o, Yo, 00, Po, w, Q. 
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E Exercício 4.7.2. A solução que acabamos de encontrar para o movimento da moeda 


rolante não vale se Q = 0. Obtenha a solução neste caso. E 


Surpreendentemente, no caso 2 Æ 0 o acoplamento entre a translação e a rotação faz 
com que o movimento do centro de massa da moeda ao londo do eixo y seja limitado e 
oscilante: se o plano inclinado for suficientemente extenso, a moeda sempre permanecerá 


sobre o plano. 


4.8 As Equações de Euler 


Seja N o torque em relação a um ponto O, que é um ponto fixo do corpo rígido ou é 


o seu centro de massa. Do ponto de vista de uma sistema inercial temos 


dL 
— = N 4.8.1 
( dt i í l ) 


donde 
(=) +wxL = N. (4.8.2) 


O tensor de inércia varia com o tempo se estiver referido a eixos fixos no espaço. Relativa- 
mente a eixos atados ao corpo, no entanto, o tensor de inércia é independente do tempo, 
o que torna as equações de movimento do corpo rígido substancialmente mais simples. A 
vida simplifica-se ainda mais com a escolha dos eixos fixos no corpo como eixos principais 
de inércia, o que será feito doravante. As componentes da Eq.(4.7.2) ao longo de eixos 


principais de inércia fixos no corpo são 


dL 
Pi + wə Ls J w3 Lo = M , (4.8.3) 


com as demais sendo obtidas a partir desta por permutação cíclica dos subscritos. Fazendo 


uso de Ly = hwi, Ly = bw», L3 = I3w3 podemos escrever 


hwy — (Jo — 15) w2 w3 Ny 5 


In Wo v= (13 — l) w3 wy No 5 (4.8.4) 


Is ws = (L — Ig) wy we = N3 E 
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Estas são as célebres equações de movimento de Euler para um corpo rígido, e descrevem 
como o eixo instantâneo de rotação (definido pelo vetor w) varia com o tempo relativa- 
mente a um sistema de referência solidário ao corpo. Uma solução completa do problema 
dinâmico, que permita uma visualização do movimento do corpo, requer ainda que se 
determine a orientação instantânea dos eixos ligados ao corpo em relação a um sistema 
de eixos inerciais externos. Mesmo no caso mais simples de rotação livre (N = 0), a es- 
pecificação completa do movimento de um corpo rígido arbitrário constitui um problema 
de difícil resolução. O problema simplifica-se consideravelmente se o corpo tem um eixo 
de simetria. Em vez de tratar genericamente um corpo simétrico em rotação livre, vamos 
considerar um exemplo especial que contém as principais características do caso geral com 


a virtude complementar de permitir uma visualização mais clara do movimento. 


E Exemplo 4.7.1. Um prato de plástico (“frisbee”) é arremessado quase horizontalmente para 
o ar, de modo que o prato gira ao mesmo tempo que seu plano oscila. Descreva o movimento 
de rotação do prato e mostre que as oscilações são duas vezes mais rápidas do que a rotação do 
prato em torno do seu próprio eixo de simetria. 


Solução. Seja 13 o momento principal de inércia em torno do eixo de simetria do prato e 
I, = Ig os momentos principais de inércia em torno de dois eixos mutuamente perpendiculares 
contidos no plano do prato e passando por seu centro de massa. Como é nulo o torque em relação 
ao centro de massa exercido pelo peso, as equações de Euler (4.8.4) reduzem-se a 


l wy = (L — 13) w2 w3 = 0 5 


0, (4.8.5) 


bw, — (Iz — h) wzw 


0. 


I3 w3 


Esta última equação mostra que w3 permanece invariável. Definindo a constante 


I3 —I 
Q = Sus , (4.8.6) 
h 
ficamos com 
Wy = —Q W2 , w2 = Qw R (4.8.7) 
Destas equações deduz-se imediatamente 
wo + Mw =0. (4.8.8) 


Com uma escolha apropriada da origem do tempo, a solução desta última equação pode ser posta 
na forma 
wi = Acos Nt , (4.8.9a) 
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Figura 4.8.1: Precessão do eixo instantâneo de rotação de um corpo rígido simétrico. 


donde 
= Asen Qt , (4.8.9b) 


sendo A uma constante arbitrária. O movimento executado pelo eixo instantâneo de rotação, isto 
é, pelo vetor w, está representado na Figura 4.8.1. O vetor w | = wÊ 1 + wo, gira com velocidade 
angular Q em torno do eixo 3, ao mesmo tempo que w executa um movimento de precessão em 
torno do eixo de simetria do corpo. O módulo de w é constante e igual a (w3 + A2)" 2 de modo 
que o eixo instantâneo de rotação descreve um cone à medida que precessa em torno do eixo de 
simetria. A precessão do vetor velocidade angular em torno do eixo de simetria aparece como 
uma oscilação do corpo. É importante sublinhar que a precessão de w é relativa a eixos fixos 
no corpo, os quais, por sua vez, giram no espaço com velocidade angular w, o que torna difícil a 
visualização do movimento. 


A escolha das direções dos eixos principais de inércia no plano perpendicular ao eixo de 
simetria é arbitrária. Assim, podemos escolher num dado momento o eixo x” = xı coincidente 


com a linha nodal, de modo que no instante em questão 1) = O e as componentes da velocidade 
angular tornam-se mais simples: 


w= , wo = send , wz = ġ cos 6 + h. (4.8.10) 


Para simplificar ainda mais a análise, tomemos os eixo z do sistema de eixos fixos no espaço ao 
longo do vetor momento angular L, que é uma constante de movimento. Uma vez que a linha 
nodal é perpendicular ao eixo z, temos: 


Lı=0 , Ly=Lsenô L3=Lcosé. (4.8.11) 


Assim, com a ajuda de (4.5.3), obtemos 


4.8. AS EQUACOES DE EULER 155 


- Ty . wo L L3  Lcos @ 
L i i ERA 13 I3 ( ) 


O ângulo de inclinação do eixo de simetria do corpo em relação ao vetor momento angular 
permanece constante. No caso do prato tem-se I3 = 21, em virtude do teorema do eixo perpen- 
dicular. Para um prato lançado quase horizontalmente o vetor momento angular é praticamente 
vertical, O é pequeno e ¢ = 2w, isto é, a taxa de oscilação do prato (que coincide com a taxa 


de precessão) é duas vezes maior do que a taxa de rotação em torno do próprio eixo.“ E 


Na ausência de torques (N = 0) as equações de Euler admitem soluções tais que 
w possui componente diferente de zero e constante somente ao longo de um dos eixos 
principais de inércia. Por exemplo, w = O quo = w3 = 0 é solução de (4.8.4) se 
N = 0. Portanto, a rotação uniforme em torno de um dos eixos principais de inércia 
representa uma situação de equilíbrio para um corpo rígido livre (não sujeito a torques). 
Isto é importante para aplicações mecânicas, pois uma roda ou um volante só permanece 
girando uniformemente em torno de um dado eixo na ausência de torques se o eixo em 
questão for um eixo principal de inércia. Para manter um corpo girando com velocidade 
angular constante em torno de um eixo qualquer é necessário aplicar um torque ao corpo, 
resultando num maior desgaste no eixo. Uma questão interessante é se o movimento de 
rotação uniforme em torno de um eixo principal de inércia é um estado de equilíbrio estável 


ou instável. 
E Exemplo 4.7.2. Mostre que só é estável a rotação uniforme em torno dos eixos principais 
de inércia de maior ou menor momento de inércia. 


Solução. Suponha que a rotação em torno de um eixo principal de inércia, digamos o 
terceiro eixo, seja ligeiramente perturbada de tal modo que apareçam componentes w1, W2 < w3. 


“Este problema desempenhou um papel bastante peculiar na trajetória científica do grande físico 
americano Richard Feynman. Em meados de 1947 Feynman era professor na Universidade Cornell. Depois 
de haver concluído o doutorado em Princeton e ter participado do Projeto Manhattan de construção da 
bomba atômica, em Los Alamos, ele atravessava uma fase improdutiva que o levou a pensar que estava 
acabado (“burned out”) para a Física. Feynman preferia almoçar no restaurante estudantil porque gostava 
de olhar as moças bonitas. Um dia, durante o almoço, alguém de brincadeira arremessou para o ar um 
prato com o emblema do fundador da Universidade Cornell e Feynman observou como ele oscilava enquanto 
girava em torno do próprio eixo de simetria. Sem nada para fazer, ele formulou e resolveu as equações 
de movimento do prato oscilante-girante. Animado com a resolução do problema, Feynman dirigiu-se 
à sala de Hans Bethe e lhe contou o que tinha visto no restaurante e o que havia calculado. “Mas que 
importância tem isso?” , perguntou Bethe. Feynman lhe disse que não tinha nenhuma importância nem ele 
ligava para isso, mas havia sido divertido. Ele decidiu que daquele momento em diante iria se se divertir 
com a Física e só faria o lhe desse prazer. Esse episódio reacendeu em Feynman a paixão lúdica pela 
Física e ajudou a pôr fim ao estado depressivo em que ele se encontrava (Feynman 1985; Mehra 1994). 
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O problema resume-se a descobrir se w e w2 permanecem pequenas, caso em que o equilíbrio 
será estável. As equações de Euler com N = 0 escrevem-se, aproximadamente, 


l wy = (I — I3) w2 w3 = 0 $ 
hoz — (B - h)wsw = 0, (4.8.13) 
Bw = 0, 
onde o termo proporcional ao produto ww» foi desprezado por ser, por hipótese, muito pequeno. 


Conclui-se que w3 é aproximadamente constante e, diferenciando a primeira e usando a segunda 
das equações (4.8.13), deduz-se 


in +w =0, (4.8.14) 
onde 
Is — In)(I3 — I 
02 = Us at 2 1) y2 . (4.8.15) 
119 
Se 02 > 0, podemos escrever 
Oo(lg — I 
wilt) = w1(0)cos Qot , we(t)= we sen Qot , (4.8.16) 
1W3 


de modo que w1 e w2 oscilam harmonicamente em torno da situação de equilíbrio w = w2 = 0, a 
perturbação permanecendo pequena se, inicialmente, for suficientemente pequena. Mas 0? >0 
se: (i) B > Ig e Ig > h; I3 < In e Ã< h. Assim, a rotação uniforme é estável em torno dos 
eixos principais de inércia de maior ou menor momento de inércia. Se 22 < 0, ou seja, se 13 < Ip 
el)>h,oul;>hbel;<h,wew são funções exponenciais do tempo e a perturbação 
inicialmente pequena acaba por tornar-se grande: a rotação é instável se realizada em torno do 
eixo principal de inércia associado ao momento principal de inércia de valor intermediário. Este 
comportamento pode ser observado qualitativamente com qualquer objeto com a forma de um 
paralelepípedo: um bloco de madeira ou uma caixa de fósforos cheia. Basta segurar o objeto 
com o eixo escolhido na direção vertical, aplicar-lhe uma rotação em torno do referido eixo e 
deixá-lo cair livremente sob a ação do campo gravitacional. É fácil produzir uma rotação estável 
do corpo em torno dos eixos de menor ou maior momento de inércia. Mas as tentativas de pô-lo 
a girar em torno do eixo intermediário, por mais cuidadosas que sejam, degeneram rapidamente 
numa oscilação irregular, com o eixo de rotação perambulando aleatoriamente ao redor do corpo 
(Romer 1978). E 
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E Exercício 4.7.1. Mostre que energia cinética em relação ao ponto O satisfaz a equação 


dE. 


2 EAN: 4.8.17 
= = Nw, (4.8.17) 


conhecida como teorema da energia cinética. E 


4.9 A Construção de Poinsot 


Quando não há torque, o vetor momento angular e a energia cinética são constantes 


de movimento: 


L =] w = constante, (4.9.1) 
1 o 
Fe al I w = constante . (4.9.2) 


Com base nestas constantes, e no caso geral em que o corpo rígido não é necessariamente 


simétrico, Poinsot concebeu uma elegante representação geométrica do movimento. 


Definindo o vetor 


r= —— (4.9.3) 
a Eq.(4.9.2) toma a forma 
rIir=l. (4.9.4) 


Passemos a interpretar r como o vetor posição de um ponto do eixo instantâneo de rotação 
do corpo a contar da mesma origem O em relação à qual o tensor de inércia é calculado. 
Esta última equação define a superfície de um elipsóide porque, escrevendo-a relativamente 


a eixos principais de inércia do corpo rígido, ela reduz-se a 
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Figura 4.9.1: A construção de Poinsot. 


ane DE —1/2 svete mi? . sod Zi 
que representa um elipsóide com semi-eixos J; / sd / A / , conhecido como elipsóide 


de inércia. Num sistema cartesiano arbitrário, a Eq.(4.9.4) apenas representa o mesmo 
elipsóide com seus eixos inclinados em relação aos eixos coordenados. O vetor normal à 
superfície do elipsóide de inércia no ponto definido pela extremidade do vetor r é propor- 


cional a 


o a O i ð E ð 
V(r- I Tr) = (è Ea + € dx, | êg) (ai + hz? + I3x°3) 
X A A o [2 
=) (1,718 + 1o,x,65 + 1917383) =2 I r= T L 5 (4.9.6) 


e o plano tangente ao elipsóide de inércia no ponto r é perpendicular ao vetor L, conforme 
ilustra a Fig.(4.9.1). A distância da origem do elipsóide de inércia ao plano tangente no 


ponto r é 


Loriw or 
e TE es =constante . (4.9.7) 


L INOD L 


O plano tangente ao elipsóide é completamente fixo no espaço, pois não apenas a direção 
normal ao plano é fixa como também a distância do plano à origem dos eixos coordenados é 
imutável, daí ser chamado de plano invaridvel. A posição do plano invariável relativamente 


ao centro do elipsóide de inércia é determinada pelas condições iniciais: L e T. Tendo 
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em vista que o ponto de contato do elipsóide com o plano invariável pertence ao eixo 
instantâneo de rotação (r é paralelo a w), o elipsóide de inércia rola sem deslizar sobre o 
plano invariável. À medida que o elipsóide rola sem deslizar, o ponto de contato descreve 
uma curva sobre o elipsóide, chamada de polodia,” e uma curva sobre o plano invariável, 


denominada herpolodia.® 


Quando o corpo é simétrico (J; = Iz) o elipsdide de inércia é um sólido de revolução 
em torno do eixo de simetria e constata-se sem dificuldade que a polodia e a herpolodia são 
circunferências. Com efeito, as Eqs.(4.8.5) mostram que w3 é constante e w descreve um 
cone em torno do eixo de simetria chamado cone do corpo. De acordo com a Fig.(4.8.1) o 


semi-ângulo a, do cone do corpo é dado por 


tan a, = Es 4 (4.9.8) 


e=— = =", 4.9.8 
cos Q F ( ) 


de modo que o eixo instantâneo de rotação traça um cone no espaço com semi-ângulo a. 
O vetor w pertence simultaneamente ao cone do corpo e ao cone do espaço, de sorte que 
o eixo instantâneo de rotação é a linha de contato entre os dois cones. Uma vez que os 
pontos do eixo instantâneo de rotação permanecem instantaneamente em repouso, para 
gerar o movimento o cone do corpo rola sem deslizar sobre o cone do espaço, que é fixo 
porque L é fixo no espaço. Assim, é claro que as curvas traçadas pelo eixo instantâneo 
de rotação sobre o elipsóide de inércia e sobre o plano invariável são circunferências. No 
caso geral de corpo assimétrico, as expressões analíticas da polodia e herpolodia são muito 


complicadas, envolvendo funções elípticas (Whittaker 1944). 


A guisa de comentario final sobre o caso simétrico, notemos que o cone do corpo 
pode estar dentro ou fora do cone do espaço, conforme está ilustrado na Fig.(4.9.2). Seja 


w = wn e note que 


is 16,64 + 16565 + 156363 = h 1 +(I3 = 1,)e383 ; (4.9.9) 


5Do grego pólos (eixo) e odós (caminho). 
6O caminho serpentino. 
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Figura 4.9.2: Os cones do corpo e do espaço. 


donde 


L= = = =n+ (cos açês , (4.9.10) 
w 
onde levamos em conta que cos a, = h - êg e definimos 


eT, 


B É 


(4.9.11) 


Observando que £ é paralelo a L e considerando a Fig.(4.9.3), conclui-se de imediato que 
o cone espacial está dentro do cone do corpo se 8 > 0 e fora do cone do corpo se 3 < 0. 
Este último caso corresponde a um corpo alongado (“acharutado”) na direção do eixo de 


simetria, ao passo que 3 > 0 refere-se a um corpo achatado na direção do eixo de simetria. 


4.10 Pião Simétrico com um Ponto Fixo 


Genericamente, um pião simétrico é um corpo qualquer com A = I. Suponhamos 
que ele seja capaz de girar em torno de um ponto fixo O do eixo de simetria, localizado a 
uma distância / do centro de massa, num campo gravitacional uniforme (Fig. 4.10.1). O 
movimento do pião será descrito em termos dos ângulos de Euler ¢,0,w. O ângulo 6 mede 


a inclinação do eixo de simetria do pião relativamente à vertical, ao passo que à descreve 
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Figura 4.9.3: Vetores introduzidos para analisar as posições relativas dos cones do corpo 
e do espaço. 


Figura 4.10.1: Pião simétrico com um ponto fixo. 


a precessão deste mesmo eixo em torno da direção vertical. Finalmente, 1) descreve a 
rotação do pião em torno do seu próprio eixo de simetria (vide a definição dos ângulos de 


Euler na Seção 3.3). 


Em vez de empregar as equações de Euler (4.8.4), revela-se mais vantajoso lançar mão 
do formalismo lagrangiano para a análise do movimento do pião. Já que a única força 


aplicada é o peso, a lagrangiana escreve-se 


1 
L=T-V=—h (w? + w2) ṣ4 a 183 — mgl cos 0 E (4.10.1) 


pois 1 = Ig. Note que os eixos 2’, y', z’ da Fig. 3.3.1 são os mesmos eixos 1, 2,3 da Fig. 


4.10.1. Assim, recorrendo as Eqs.(3.4.24), a lagrangiana assume a forma 


lo. due. 1 oo. 
L = at 8? + ah o° sen?6 + 313 (q + cos 0)? — mgtcos 0 . (4.10.2) 
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As variáveis % e @ são cíclicas, logo os momentos conjugados correspondentes são as 


constantes de movimento py € pe: 


L EE 
T = 13(W + cos 0) = Iz w3 = py = constante , (4.10.3) 
OL be a fee 
36 = hq sen*6+13 cos 0(+¢cos 0) = Nó sen*0+py cos O = py = constante . (4.10.4) 


E Exercício 4.10.1. Mostre que o torque exercido pelo peso não tem componente ao longo 
da direção 3. Use, em seguida, as equações de Euler para deduzir a constante de movimento 
(4.10.3). E 


Uma vez que uma variação do ângulo q implica uma rotação em torno do eixo vertical 
Z, pọ é a componente z do momento angular, L,. A conservação de L,, por sua vez, é 
facilmente compreendida notando que o torque devido ao peso não possui componente na 


direção vertical. Outra constante de movimento de importância fundamental é a energia:” 


i ee? ee OD leart 
E=T+V = 516º gh sen’O + 13 (p + bcos 0)? + mgtcos 0 . (4.10.5) 


Essas três constantes de movimento permitem reduzir a solução do problema a quadraturas.º 


De fato, escrevendo 


b+ ¢cos 6 = py/T3 , (4.10.6) 
-Pe — Py Cos O 

ee 4.10.7 

? 1, sen?6 ( ) 


e introduzindo a nova constante 


TA lagrangiana não depende explicitamente do tempo e a energia cinética é função homogênea do 
segundo grau das velocidades, de modo que a integral de Jacobi h é a energia (vide Seção 2.6). 

“Resolver o problema por quadraturas significa exprimir a solução do problema em termos de integrais 
de funções conhecidas. 
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Papot. 4.10.8 
I, ( ) 
deduzimos 
ti 
E' = 5h6º + Var(0) , (4.10.9) 
onde 9)? 
Po — Py COS 
Veg) = a o - mglcos 0 . (4.10.10) 
Separando variáveis na Eq.(4.10.9) obtém-se 
9 dé 2 
= 4.10.11 
n [E no Vog(0)]!/2 A t ( 0 ) 


onde ĝo é o valor de O no instante inicial t = 0.º Em princípio, portanto, uma única 
quadratura (integração) permite determinar t como função de 0, uma inversão adicional 
fornecendo 6(t). Uma vez encontrada a dependência temporal de 0, determina-se ¢(t) 
por uma integração da Eq.(4.10.7). Finalmente, dispondo de O(t) e ¢(t), obtém-se w(t) 
por uma última integração utilizando a Eq.(4.10.6). A integral em (4.10.11), no entanto, 
não pode ser expressa em termos de funções elementares — salvo para condições iniciais 
muito particulares —, de modo que, em geral, 0 exprime-se em função de t em termos de 
funções elípticas de Jacobi.!º Afortunadamente, as características principais do movimento 
do pião podem ser inferidas sem a necessidade de lidar com essas funções relativamente 


complicadas. 


O comportamento de 6(t) pode ser analisado pelo método do potencial efetivo com a 
ajuda da equação (4.10.9). Consideremos uma situação geral em que py + pg (um exemplo 
do caso especial py = pg Será tratado mais adiante). O intervalo fisicamente aceitável para 
0 é [0,7], e de (4.10.10) deduz-se que Vog(0) — œ para O — 0 ou 7. Por outro lado, a 


derivada do potencial efetivo anula-se para 0, tal que 


(Do — Py cos fo) (Py — Po cos 0o) 
1, sen30 


Vig(90) = —mgl sen bo 4 = 0% (4.10.12) 


Se Ê < 0 no instante t = 0 deve-se tomar a raiz quadrada negativa no lado esquerdo de (4.10.11). 

10Uma excelente introdução às funções elípticas encontra-se em (Synge & Griffith 1959). Para outros 
detalhes a respeito de integrais elípticas e funções elípticas, (Spiegel 1971) é uma referência que prima 
pela concisão e objetividade. 
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Figura 4.10.2: A interseção das curvas definidas por f(u) e g(u) fornece o único valor de 
ĝo = cos tuo que anula Ve (9). O caso representado corresponde a pype > 0. 


Figura 4.10.3: O potencial efetivo Vog(0). 


Fazendo u = cos o, esta última equação equivale a 


mgth(1 — u”)? = (po — pyu) (py — pou) - (4.10.13) 


Denotando o lado esquerdo de (4.10.13) por f(u) e o lado direito por g(u), podemos 
determinar graficamente o número de interseções das curvas definidas por f(u) e g(u) 
para —1 < u < 1. As raízes de f(u) são +1, a tangente ao gráfico de f(u) é horizontal em 
u = 0, +1 e f(u) — oo para u — too. Por outro lado, as raízes de g(u) são uo = Po/Pw 
e 1/uo, de modo que se ug pertence ao intervalo [—1,1] então 1/uo não pertence a [—1, 1] 
e vice-versa. Em outras palavras, há apenas uma raiz de g(u) no intervalo fisicamente 
significativo. Estas informações bastam para traçar a Fig. 4.10.2, que torna claro que a 
equação (4.6.12) possui uma única solução wo no intervalo físico, ou, equivalentemente, 
há um único valor 4) € [0,7] que anula Ve p(0). Inferimos, assim, que a forma de Vo¢(4) é 


aquela esboçada na Fig. 4.10.3. 
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Em geral, dado um valor de F’ o ângulo 6 oscila periodicamente entre os valores 04 e 
05 indicados na Fig. 4.10.3. Diz-se que o eixo de simetria do pião executa uma nutação 
em relação à vertical. Durante a nutação a velocidade angular de precessão do eixo do 


pião em torno da direção vertical é, em cada instante, 


Pára 0 
= Po— Py Cos O pp 08 
— = 4.10.14 
2 1, sen20 é I sen?6 ( ) 


Há diversas possibilidades, a saber: 


(i) |po| > |py|. A taxa de precessão ¢ tem sempre o mesmo sinal durante todo o tempo. 


(ii) |po| < |py|. Introduzindo o ângulo auxiliar 9" € [0,7] definido por cos 0º = ate 


temos @ = (cos 6’ — cos 0)/T, sen2@ . Para determinar a posição de 6’, note que a equação 
(4.10.12) fornece Vie(0’) = —mgésen 6" < 0, de modo que 6" < 0o. Se 9" < 61 então $ tem 
sempre o mesmo sinal durante todo o movimento. Neste caso, assim como no anterior, 
o eixo de simetria do pião traça, sobre uma esfera centrada no ponto O, uma curva que 
assemelha-se à mostrada na Fig. 4.10.4(a). Se 0’ > 6, ó troca de sinal durante a nutação 
e o movimento corresponde ao indicado na Fig. 4.10.4(b). A situação retratada na Fig. 


4.10.4(c) corresponde a 6’ = 61. Este último caso não é tão excepcional quanto parece. 


Suponha, por exemplo, que as condições iniciais sejam 6 = 0,4 = 0, = w3, de modo que 


o único movimento inicial do pião consiste numa rotação em torno de seu próprio eixo de 


simetria. Com essas condições iniciais tem-se 


Py = Iaw3 ; Po = Py cos A, , 
donde 
cos 6 = Pé = cos 64 => =. 
Py 
Se E' = 00) o ângulo O permanece constante e igual a 09, não ocorre nutação 
ef 


e o eixo de simetria do pião executa uma precessão regular em torno da vertical com a 


velocidade angular constante 
; _ Po — Py COS bo 


4.10.15 
4 I sen?4 ( ) 
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Figura 4.10.4: As combinações possíveis dos movimentos de precessão e nutação . 


Há, em geral, dois valores possíveis para é porque a equação (4.10.12) é quadrática em 


o = po — Py Cos do . (4.10.16) 
De fato, 
Py — Po COS Io = Py sen?) — o cos bo , (4.10.17) 
de modo que (4.10.12) torna-se 
ga? cos ĝo — 0Py sen’) + mglI sento = 0, (4.10.18) 


cujas soluções são 


e Tzw sen? h E j _ Amgll cos >] (4.10.19) 


0 
2cos 06 Igws 


onde usamos py = I3w3. Se 69 < 7/2, de modo que cos 6 > 0, a velocidade angular do 
pião em torno de seu eixo de simetria não pode ser inferior a um valor mínimo!! para que 


o pião possa precessar regularmente com ângulo de inclinação 06: 


A4mgtl, cos 0 e 
eae (eee) (4.10.20) 


No caso de um giroscópio suspenso pelo topo, ĝo > 7/2 e a precessão regular é possível qualquer que 
seja o valor de w3. 
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Se w3 > wmin há duas soluções para o = py — py cos Oo, correspondendo a uma precessão 


lenta e outra rápida. Para w3 >> wmiy temos os seguintes valores aproximados: 


T3003 mgl 


, Penta ~ (4.10.21) 


Prápida ~ I, cos Oo T3W3 
E Exercício 4.10.1. Deduza estes dois últimos resultados aproximados aplicando uma ex- 


pansão binomial à Eq.(4.10.19). E 


O último problema importante que investigaremos é o da estabilidade de um pião posto 
a girar na posição vertical, também conhecido como pião dormente.!2 As condições iniciais 
6(0) = 0,1(0) = ws implicam, pela equação (4.10.4), Po = py. Em tais circunstâncias o 


potencial efetivo torna-se 


2 2 2 
_ Py (1 —cos 0) Py, 20 
S ent + mgl cos O = JA tan 5 +mgtcos 0 . (4.10.22) 


Vos (9) 


Para pequenas nutações relativamente à posição vertical, 


AM 02 Deer 
Vo. + mgt(1 — o =mglt sk , (4.10.23) 


onde 


[2 2 
k= ae -mgl . (4.10.24) 


Para pequenos valores de 0 o gráfico de Vog(0) é uma parábola com um mínimo em 0 = 0 
se k > 0, e um máximo em 0 = 0 se k < 0. Conseqtientemente, o movimento do pião com 


eixo de simetria vertical será estável se k > 0, ou seja, se 


(4.10.25) 


120 leitor é remetido a Whittaker (1944) para outros aspectos do movimento do pião, bem como para 
a solução exata em termos de funções elípticas. 
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Em outras palavras, a velocidade angular do pião em torno do seu próprio eixo possui 
um valor crítico we abaixo do qual o movimento de rotação do pião na posição vertical 
torna-se instável. Se w3 > we as pequenas oscilações do eixo em torno da direção vertical 
permanecem pequenas, o eixo de simetria do pião continua praticamente vertical e ele 
rodopia serenamente, parecendo parado, dormente. Na prática, se um pião é posto a girar 
quase verticalmente com w3 > we, ele fica “adormecido” até que, por causa do atrito, w3 
torna-se menor do que w., quando o pião “desperta” e começa a cambalear, com seu eixo 
de simetria afastando-se cada vez mais da vertical até o pião cair. Qualquer pessoa que 


tenha brincado com piões certamente já terá observado esse comportamento. 


PROBLEMAS 


4.1. O cubo do Exemplo 4.6.1 é posto a girar em torno da aresta que coincide com o 
eixo z. Determine o vetor momento angular do cubo e o ângulo que ele faz com o vetor 


velocidade angular. 


4.2. (i) Dado um tensor arbitrário T, prove que 


dT dT = A 
es E com + wx T— T xw. 


Usando L = ww, (dL/dt)inerciaa = N e o resultado do item anterior, deduza as equações 


de Euler para o movimento de um corpo rígido. 


4.3. Uma nave espacial simétrica move-se no espaço sideral. Motores simetricamente 
situados aplicam um torque constante N3 ao longo do eixo de simetria. (i) Supondo que 
w3(0) = 0, determine ws(t). (ii) Prove que w? + w2 é constante de movimento. (iii) 
Tomando como condições iniciais w (0) = 0 e ws(0) = Q, determine w(t) e wo(t). 
Descreva o movimento executado pelo vetor velocidade angular relativamente aos eixos 


principais de inércia. 


4.4. (i) Determine os eixos e momentos principais de inércia de uma placa homogênea 


retangular, de lados a e b, em relação a um dos vértices. (ii) Uma placa homogênea 
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retangular está suspensa por um dos vértices e pode oscilar num plano vertical coinci- 
dente com o plano da placa. Determine o período das pequenas oscilações da placa e o 


comprimento do pêndulo simples equivalente. 


4.5. Determine os eixos e momentos principais de inércia em relação ao vértice de um 
cone homogêneo de altura h e raio da base R. Sabendo que o centro de massa do cone 
encontra-se a uma distância 3h/4 do vértice, obtenha os eixos e momentos principais de 


inércia em relação ao centro de massa. 


4.6. Uma haste homogênea de comprimento 2/ e massa m está presa por uma extre- 
midade a uma mola cuja constante elástica é k, e que pende de um um suporte fixo. A 
haste pode oscilar num plano vertical e a mola está restrita a mover-se apenas para cima 


ou para baixo. Escreva a lagrangiana e as equações de movimento desse sistema. 


4.7. Os momentos principais de inércia de J), I2, I3 de um corpo rígido em relação ao 
centro de massa são todos distintos. Se o centro de rotação do corpo passar a ser um 
ponto O deslocado de um vetor s em relação ao centro de massa, mostre que apenas se 
s for ao longo de um dos eixos 1,2,3 é que os eixos principais de inércia passando pelo 


ponto O serão paralelos aos eixos 1,2,3. 


4.8. A aceleração centrífuga a, = w x (r x w) depende linearmente de r, logo pode ser 
escrita na forma a, =T, r. Exprima o tensor T, em termos de w e obtenha a matriz 


—> 
das componentes de T, num sistema cartesiano qualquer. 


4.9. Uma roda desce rolando um plano inclinado de um ângulo a em relação à horizontal. 
A roda se mantém perpendicular à superfície inclinada mas pode girar em torno do eixo 
normal à superfície. Encontre a solução para o movimento da roda usando o formalismo 


lagrangiano e a técnica dos multiplicadores de Lagrange. 


Capitulo 5 


PEQUENAS OSCILACOES 


Time travels in divers paces with divers persons. Pll tell you who Time ambles 
withal, who Time trots withal, who Time gallops withal, and who he stands still 
withal. 

William Shakespeare, As You Like It 


A teoria das pequenas oscilações em torno de posições de equilíbrio estável encontra 
aplicação na espectroscopia molecular, no estudo de vibrações mecânicas, na acústica e na 
teoria dos circuitos elétricos, entre outras áreas. O conceito de modo normal de vibração, 
introduzido na teoria, é de enorme importância em praticamente todos os ramos da Física, 
da teoria quântica de campos à física da matéria condensada. Se os desvios da posição 
de equilíbrio forem suficientemente pequenos, em geral o movimento poderá ser descrito 


como o de uma coleção de osciladores harmônicos acoplados. 


5.1 Caso Unidimensional 


Consideremos um sistema conservativo com um único grau de liberdade descrito pela 
coordenada generalizada q. Sem perda significativa de generalidade, suponhamos que a 
relação entre as coordenadas cartesianas e a coordenada generalizada q não envolva o 


tempo, de modo que a lagrangiana tem a forma! 


L= Sala) @ - Vha) (5.1.1) 


1Considere a versão unidimensional das equações (2.6.4) e (2.6.5). 
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com a função a(q) positiva. 


E Exemplo 4.5.1. Uma conta de massa m desliza sem atrito ao longo de um fio rígido contido 
num plano vertical e na forma de uma parábola com equação y = x? /R. O sistema encontra-se 


num campo gravitacional constante g = —gj. Usando q = x como coordenada generalizada, 
temos 
L= (+52) —mgy = (14 “ya? TS 2 (5.1.2) 
2 24 R RR? = 
que é da forma (5.1.1) com a(x) = m(1 + 4x?/R?). E 


Diz-se que a configuração q = q? é um ponto de equilíbrio se 


dV 
(Z) ee 0. (5.1.3) 


glej +5 =9 | (5.1.4) 


que possui a solução q = q” = constante desde que (5.1.3) seja verificada. Em outras 
palavras, se num dado instante o sistema encontra-se na configuração q = q!” com veloci- 
dade q = 0, o sistema permanecerá nessa situação para sempre. Por exemplo, um pêndulo 


inicialmente em repouso na posição de equilíbrio (0 = 0) assim perdurará indefinidamente. 


O equilíbrio é dito estável se uma perturbação suficientemente pequena não é capaz de 
afastar grandemente o sistema da condição de equilíbrio, mas provoca pequenas oscilações 
em torno da configuração de equilíbrio. Isto ocorre se o potencial passa por um mínimo 
na posição de equilíbrio. Se V passa por um máximo ou ponto de inflexão, o equilíbrio é 
instável. Como se depreende da Fig. 5.1.1, se uma pequena velocidade for imprimida à 
partícula na configuração de equilíbrio, aumentando ligeiramente sua energia, o desloca- 
mento permanecerá pequeno se o potencial V for mínimo, mas não será pequeno, podendo 


crescer indefinidamente, quando V é máximo ou passa por um ponto de inflexão. 


Estaremos interessados em pequenas vibrações em torno de um ponto de equilíbrio 


estável. O critério de estabilidade é 
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Figura 5.1.1: Em (a) o equilíbrio é estável, mas em (b) ou (c) é instável. 


2 
(=) > 0, (5.1.5) 
q=q 


que garante que V passa por um mínimo local em q = qº. Defina 


q=% tn (5.1.6) 


onde 7 é o deslocamento da posição de equilíbrio. Supondo 7 suficientemente pequeno, 


podemos aproximar V(q) nas vizinhanças da posição de equilíbrio por 


dV 1/d2V 
V(g) = V(gO +n) =V(q®) + (=) nt = (Ss PA. (5.1.7) 
dq q=a(9 21 dq q=q® 


O termo linear em 77 nesta última equação é nulo em virtude da Eq. (5.1.3). Portanto, até 


segunda ordem em 7, 


1 
Vig) = Vo + RO", (5.1.8) 
onde 
dV 
KO = (=) > 0 (5.1.9) 
dq q=q) 
e Vo = V(q) é constante e igual ao valor da energia potencial na configuração de 


equilibrio. 
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Coerentemente, façamos uma expansão da energia cinética até segunda ordem em ņ e 


n. Temos 


alq) = a(q® +n) = alg) + a! +. (5.1.10) 


dq 
Porém, como q = 1), vemos que o termo linear em 77 nesta última equação daria lugar na 
energia cinética a um termo proporcional a 7)”, que é cúbico nas quantidades pequenas 17 


e 7. Portanto, mantendo no máximo termos quadráticos em 7 e 1, a lagrangiana (5.1.1) 


escreve-se 
(0) pO 
Q 
E cae 5.1.11 
T ( ) 
onde 
a = alg) , (5.1.12) 


tendo sido descartada a constante Vo, pois nao afeta a equação de movimento para 7. 
Constata-se imediatamente que (5.1.11) tem a forma da lagrangiana de um oscilador 
harmônico de “massa” a) e “constante elástica” k(9), de modo que 1 executa oscilações 


harmônicas em torno de m = 0 com fregiiência angular 


VAO) 1/2 
No Exemplo 5.1.1 claramente x = 0 é ponto de equilíbrio estável, pois V’(0) = 
(2mgz/R)z=0 = 0 e V"(0) = 2mg/R > 0. Portanto, de acordo com (5.1.13), a freqiiéncia 


das pequenas oscilações em torno de x = 0 será w = (2g/ R)". 

E necessário sublinhar a hipótese de que a expansão do potencial em torno da posição 
de equilíbrio seja dominada pelo termo de segunda ordem. Nos casos anômalos em que o 
termo de segunda ordem está ausente, o movimento oscilatório em torno das posições de 


equilíbrio estável não será harmônico simples e a análise acima não se aplica. 


E Exemplo 5.1.2. Uma conta de massa m desliza ao longo de uma haste cilíndrica lisa ligada a 
uma mola com constante de força k e comprimento natural @, conforme a Fig. 5.1.2. Determinar 
as posições de equilíbrio e classificá-las quanto à estabilidade nos casos? > ae <a. 
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Figura 5.1.2: Exemplo 5.1.2 


Solução. Usando como coordenada generalizada o deslocamento horizontal x, a lagrangiana 
escreve-se 


L= se (Vi? + 2 — £)? , (5.1.14) 


As posições de equilíbrio satisfazem 
dV x 
—=k 2 2_ f) —— = 0 5.1.15 
ig = MVP - NF , (5.1.15) 


cujas soluções são x = 0 e z = +V 0? — a? (se! > a). Para investigar a estabilidade devemos 
determinar o sinal de 


d2V r? a? 


= 24 r2 
da? rs + ee e) (a? + x?)3/2 


(5.1.16) 


nos pontos de equilíbrio. (1) Caso a > £. Somente x = 0 é ponto de equilíbrio, o qual é estável, 
pois 


dV £ 
x=0 


(=, (5.1.18) 


(ii) Caso a < £. Há três posições de equilíbrio, x = 0 ou x = +y — a?. O ponto x = 0 agora é 
posição de equilíbrio instável porque V”(0) < 0. Por outro lado, as posições x = +v? — a? são 
de equilíbrio estável porque 


d2V a? 
(sr) = kl-5) > 0, (5.1.19) 
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Figura 5.1.3: Exemplo 5.1.3 


sendo 
k a2 
w= —(1- 2) (5.1.20) 
a frequência das pequenas oscilações em torno dessas posições . E 


Neste último exemplo, note que se a = £ nos deparamos com a situação anômala 
mencionada anteriormente: a única posição de equilíbrio é x = 0 mas o termo dominante 


na expansão do potencial em torno de x = 0 é de quarta ordem. 


E Exemplo 5.1.3. Uma conta de massa m desliza sem atrito ao longo de uma circunferência de 
raio R que gira em torno de seu diâmetro vertical com velocidade angular constante w, conforme 
a Fig. 5.1.3. Estudar as configurações de equilíbrio e classificá-las quanto à estabilidade. 


Solução. Com a coordenada 0 indicada na Fig. 5.1.3, as coordenadas cartesianas da 
partícula de massa m sao x = Rsin0cosy,y = Rsin Osin y, z = —Rcos 0 onde q = wt é 
o ângulo de rotação em torno do eixo vertical z. A lagrangiana é dada por 


L=T-V= (RB? + R?w? sin? 0) — mgR(1 — cos 6) , (5.1.21) 


o nível zero do potencial gravitacional tendo sido tomada no ponto mais baixo da circunferência. 
A lagrangiana (5.1.21) é da forma (5.1.1) com um potencial efetivo 


2 


1 
Vag(0) = mgR|(1 — cos 0) — = sin? | , (5.1.22) 


e 2 


c 


onde we = \/g/R. As posições de equilíbrio são as soluções de 
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Figura 5.1.4: Potencial efetivo (5.1.22) nos casos (a) w < we e (b) w > we. 


2 


dV w 
ef 9 _ : = 
D mgR [sin 0 = Sin 0 cos o] = (5.1.23) 


Cc 


e as condições de estabilidade são determinadas pelo sinal de 


de Vof 
dé? 


w? 5 
= mgR [cos 0 — ri cos” 0 — 1)| (5.1.24) 


c 


nas configurações de equilíbrio. Dois casos são possíveis: (i) se w < we as soluções de (5.1.23) 


são 0 = 7 e 0 = 0, e, como Vie(0) = mgR[ — w?/w?] > 0, esta última posição é de equilíbrio 


estável (0 = 7 é posição de equilíbrio instável); (ii) se w > we outras duas soluções de (5.1.23) 


são 0 = +69 com cos ĝo = (we/w)?. Agora 0 = 0 é instável (0 = 7 continua instável) e as 


configurações de equilíbrio estável são 0 =+0,, pois Viel bo) = mgR(w* — wi) /(w?w?) > 0. 
O gráfico de Vog(0) para w > we e w < we está mostrado na Fig. 5.1.4. Este sistema é muito 
interessante porque exibe o fenômeno de quebra espontânea de simetria. Note que a lagrangiana 
(5.1.21) é invariante sob a transformação 0 > — 0, ese w < we, a solução de mínima energia 
é O = 0, com esta única configuração de equilíbrio estável exibindo a mesma propiedade de 
invariância que a lagrangiana. No entanto, para w maior do que a velocidade angular crítica we 


a posição 0 = 0 não é mais a de menor energia e torna-se instável. Há uma degenerescência 


dos estados de mais baixa energia (0 = +09) e a simetria é quebrada, pois a transformação 
0 — — 8 leva um estado de equilíbrio estável no outro. A instabilidade em 0 = 0 quando w 
passa pelo valor crítico we é análoga a uma transição de fase de segunda ordem em mecânica 
estatística (Sivardiére 1983). É surpreendente que este sistema mecânico tão simples seja capaz 
de revelar todas as características essenciais do fenômeno de quebra espontânea de simetria, uma 
das idéias centrais da moderna física das partículas elementares e ingrediente fundamental do 


modelo padrão das interações eletrofracas. E 


5.2. MOVIMENTO ESTACIONARIO E PEQUENAS OSCILAÇÕES 177 


5.2 Movimento Estacionário e Pequenas Oscilações 


As considerações anteriores podem ser estendidas a certos sistemas pluridimensionais 
capazes de executar movimentos estacionários, que podem ser encarados como estados 
de equilíbrio dinâmico. Tais movimentos sao encontradiços tipicamente em sistemas que 
possuem coordenadas cíclicas. Adotaremos a seguinte definição: um movimento é dito 
estacionário se, em algum sistema de coordenadas, as coordenadas não-cíclicas, isto é, 


aquelas que aparecem na lagrangiana, são constantes. 


E Exemplo 5.2.1. Em coordenadas polares a lagrangiana de uma partícula movendo-se num 
plano sob uma força central é 


ES st? +726? sin? 0) — V(r) . (5.2.1) 
A coordenada 6 é cíclica, donde mr26 = pp = constante. A equação de movimento radial 


av 
dr 


mi — mr? + 0 (5.2.2) 


possui a solução estacionária r = ro (órbita circular) contanto que (dV/dr),=r, = pg /(mrj). Por 
exemplo, se V(r) = —A/r com A > 0 temos ro = p;/(mA). Há, portanto, órbitas circulares no 


caso gravitacional ou no coulombiano atrativo. ai 


E Exemplo 5.2.2. A lagrangiana de um pêndulo esférico (isto é, não restrito a oscilar num 
plano fixo) é dada por 


me? 


L= age + 2 sin? 0) — mgf(1 — cos 0) . (5.2.3) 


A coordenada q é cíclica, de modo que mé?¢ sin? 9 = Py = constante. A equação para 0 é 
mt26 — ml? sin 6 cos 0 + mglsin 0 =0 , (5.2.4) 
que admite a solução estacionária 6 =) com cos ĝo = 9/(L/?) desde que Pp > (9//)!2. m 


Nos dois exemplos anteriores a lagrangiana não depende explicitamente do tempo e a 


energia cinética é função homogênea do segundo grau das velocidades generalizadas, de 
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sorte que h = E e h é constante de movimento. Em ambos os casos a conservação da 


energia exprime-se na forma 


dg) =E, (5.2.5) 


E=T+V= at | sre bV(r) = Zr +- Vir) , (5.2.6) 


ao passo que, no Exemplo 5.2.2, usando ml?¢* sin? 0 = pg, 


2 
Po 
2 Im? sin? 0 


— mgtcos 0 . (5.2.7) 


As configurações de equilíbrio estacionário são as soluções de 


dVog(a) 
ENE A mio 2. 


enquanto que a estabilidade depende do sinal da segunda derivada do potencial efetivo 


nas posições de equilíbrio, o sinal positivo implicando equilíbrio estável. 
E Exemplo 5.2.3. Investigar a estabilidade da órbita circular de um corpo celeste em torno 
do Sol. 


Solução. Segundo a Eq.(5.2.6), 


efr) = ra (5.2.9) 


“Imp r 


com A= GmM > 0, sendo M a massa do Sol e m a massa do corpo celeste em órbita circular. 
O raio da órbita determina-se de 


_ Wet PB A P3 


0 T E Tê r= ro = — (5.2.10) 


já obtido de outra forma no Exemplo 5.2.1. Por outro lado, 
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d2V, 3p 2A A 
KO) = ( ef SEO ee 0's (5.2.11) 
dr = mro r rè 


e as órbitas circulares são estáveis frente a pequenas perturbações,” sendo 


k0) 1/2 GM 1/2 


a freqüência das pequenas oscilações em torno da órbita circular. E 


E Exemplo 5.2.4. Estudar a estabilidade do movimento estacionário de precessão (0 = 00) 
de um pêndulo esférico. 


Solução. De (5.2.7) infere-se 


Pe 


O movimento estacionário 0 = 09 requer 
dV. pcos Oo 
—ef = mgtsin bo — DL =0. 5.2.14 
do e MIRR O me sin 8 Rane 


Fazendo uso de py = m sin? 9% resulta cos 0) = 9/(t22) contanto que ~ > (9/1)!2. Por 
outro lado, 


d2V. 2 2 2 0 
kO = ( | — mgl cos do + Po + 3 Po een = mak (1 + 3 cos? bo) >0. 
0=00 


do? ml? sin? 0o mé? sint 8) cos ĝo 
(5.2.15) 
A precessao é estavel e 
B (9) e = kO) Me bg dar 3 cos? Ao ae (5.2.16) 
alo) mt “AL coso = 
é a frequência das pequenas oscilações em torno do movimento estacionário. E 


2A presente análise não se aplica a perturbações perpendiculares ao plano da órbita. 
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5.3 Pequenas Oscilações: Caso geral 


Com as mesmas hipóteses do caso unidimensional, um sistema conservativo com n 


graus de liberdade descrito pelas coordenadas generalizadas q1,...,Gn tem lagrangiana 
1 o ad 
L= 2 So Min Ge he — V (q-a) (5.3.1) 
kl=1 
onde os My = Mu(q1,...,Ghn) são quantidades simétricas em seus índices, isto é, My = 


My (vide Eq.(2.6.5)). A configuração g® = (q2,...,g)) é uma configuração de 


n 


equilíbrio se 


OV 
(x) =0 , ke=l,...,n. (5.3.2) 
Oak O) 
Definindo 
= q k=1 5.3.3 
dk dk + Nk , peca (5.3.3) 
e expandindo V(q) até segunda ordem em potências de m,...,M resulta 
OV 1 OPV 
V(qi,---39n) = Vig) + (x) mk À mem +. 5.3.4 
G ) ew) > dq j 440) ne > Ogum j go oe a 


O termo linear nos pequenos deslocamentos é nulo em virtude de (5.3.2) e a aproximação 


dominante para V toma a forma 


1 
kl 


onde Vo = V (q®) é constante e 


8? V 
Va = i 5.3.6 
j (e l ) 


As quantidades V;,; são constantes e simétricas: Vi; = Viz. O critério de estabilidade agora 
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é um pouco mais complicado. Se V é mínimo em q = q” seu valor = pode aumentar 
em conseqiiéncia de um pequeno deslocamento da configuração q = gq. Pela Eq.(5.3.4), 


portanto, q = q® é ponto de equilíbrio estável se 


DS Vanem > 0 V (m, -.-,m) Æ (0,...,0) r (5.3.7) 
kl 


Em resumo, o equilíbrio é estável se a forma quadrática (5.3.7) construída com as segundas 


derivadas do potencial é positiva definida, hipótese que faremos de agora em diante. 


Assim como no problema unidimensional, a expansão da lagrangiana (5.3.1), correta 


até segunda ordem em 7 e 1, escreve-se 


1 aaa! 
= 5 du Thi Me™ — 3 2o Vu mM (5.3.8) 
kl kl 
onde 
Ta = Malga) (5.3.9) 


e a constante aditiva Vo foi descartada. As equações de movimento para os pequenos 


deslocamentos da posição de equilíbrio são 


d(OL\ OL 
+ (3) - =0 , j=l, Nn. (5.3.10) 


Mas 


OL 
on, =) I (Skj mM + Ùk OU) = AD nin DT in} = AD Tri + D Tie ie} ; 
j 1 k 


(5.3.11) 


porque Tk; = Tjk. Finalmente, levando em conta que o indice de soma é “mudo”, podemos 


trocar “Į” por “k” no penúltimo somatório que aparece na Eq.(5.3.11), obtendo 


s Pate. 53,12 
Em 2 J ( ) 
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Analogamente, 


OL 
k 


de modo que as equações de Lagrange (5.3.10) assumem a forma 


DTD Vem =0 5 j=1on, (5.3.14) 
k k 


que são equações de movimento de osciladores acoplados. 


5.4 Modos Normais de Vibração 


Como logo veremos, a solução geral da Eq.(5.3.14) pode ser expressa em termos de 
soluções particulares em que todos os deslocamentos m4,...,7 oscilam com a mesma 
frequéncia. Tais soluções particulares são conhecidas como modos normais de vibração. E 


conveniente substituir 7;,(t) pela função complexa z(t) e definir 


nlt) = Rezt) , k=1,...,n. (5.4.1) 


Como os coeficientes do sistema de equações (5.3.14) são reais, as partes real e imaginária 
de uma solução complexa são também soluções, o que justifica a Eq.(5.4.1). Busquemos, 


portanto, soluções complexas de (5.3.14) na forma 


z(t) = 2.0) git on (5.4.2) 


em que todos os deslocamentos vibram com a mesma frequência w. Substituindo my(t) por 
2w(t) em (5.3.14) resulta 


DU — w?Tjx) 2 =0. (5.4.3) 
k 


Definindo as matrizes 
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4 
Velho q Tee q z®=]ļ| : , (5.4.4) 
z0) 
as equações (5.4.3) equivalem à equação matricial 
(V —u?T) 2 =0. (5.4.5) 
Esta última equação só possui solução não-trivial 2 40 se 
Va- wT Vi- wTio 


det(V — w2T) = det | Vai — Ta Vo-wTo ... | =0 ; (5.4.6) 


que é uma equação algébrica de grau n para w?, possuindo n raízes 


eS à ghn (5.4.7) 
onde w1,...,Wn são chamadas de freqüências características do sistema. 
É possível encontrar n vetores linearmente independentes 9),..., 0) que satisfazem 
(5.4.5), isto é, 
(V-wyT)e?=0 , s=1,...,n. (5.4.8) 


Como V e T são matrizes reais, é sempre possível escolher cada 9!) de modo que todas 
as suas componentes sejam reais. Supondo que tal escolha tenha sido feita, a solução 


complexa mais geral associada à frequência w, escreve-se 


29 (1) = A® gO et + BO gO eTit (5.4.9) 


ois w? = w2, é satisfeita por w = w, ou w = —w,, e qualquer combinação linear de 
(s) 2 


soluções com coeficientes complexos arbitrários — A“) e B&) — continua sendo solução em 
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virtude da linearidade da Eq.(5.3.14). A solução mais geral possível para z(t) é obtida 


por superposição das soluções associadas a cada fregiiência característica ws : 


z(t) = DA test + BO et] g) , (5.4.9) 
s=] 
A solução física é 
netas (t) u = > “(ae + BO) eit 4 (AO! 4 BO) eist] gl) 
ae (5.4.10) 
já que os 08) são vetores reais por hipótese. Defina 
AD + BO” = CO etts (5.4.11) 
com C) e &, reais, de modo que 
ASP 4 BO = (AS) + Be)" = CO eis (5.4.12) 
Com o emprego destas duas últimas equações podemos escrever 
n(t) = 3 CO 9) cos (wet + ds) (5.4.13) 
s=1 
ou, em componentes, 
int) = 5 C® of) cos(wst tos), k=1,...,n. (5.4.13b) 


s=1 


A solução geral das equações de movimento (5.3.14) expressa por esta última equação 
contém as 2n constantes arbitrárias C@,...,C'™,¢1,...,¢n que podem ser determi- 


nadas pelas condições iniciais. 


E Exemplo 5.4.1. Dois pêndulos iguais executam pequenas oscilações acoplados por uma 
mola de massa desprezível. Determinar os modos normais de vibração e a solução das equações 
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Figura 5.4.1: Dois pêndulos acoplados. 
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de movimento se, em t = 0, um dos pêndulos está ligeiramente deslocado de sua posição de 


equilíbrio e o movimento tem início com ambos os pêndulos em repouso. 


Solução. Suponhamos que a configuração de equilíbrio seja 64 = 05 = 0, na qual a mola 
possui o seu comprimento natural do. Usaremos como coordenadas os pequenos deslocamentos 
horizontais m e n2 indicados na Fig. 5.4.1, que relacionam-se com os pequenos ângulos 0, e 


9» por 


m = sin 0; ~ £0, 5 no = £ sin 02 ~ LO . 
A energia cinética é 
me . me . m m 
T= 24 62 x 2 „2 


ao passo que a energia potencial escreve-se 


k 
V= z (do + n2 — m) — do]? + mglf(1 — cos 61) + €(1 — cos 62) ] . 


Usando cos 0 ~ 1 — 67/2 e (5.4.14) resulta 


de modo que 


m. . 1 mg 
L= (0408) — 5{ M? +n?) + (mom?) 


Comparando com a forma padrão (5.3.7) inferimos 


(5.4.14) 


(5.4.15) 


(5.4.16) 


(5.4.17) 


(5.4.18) 
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E _{ +k -k 
(5) (ME) wan 


Advertência. Na forma padrão (5.3.8) cada termo cruzado aparece duas vezes. Por exem- 
plo, na segunda soma dupla sobre k e l há um termo com k = 1,/ = 2 e outro com k = 2,/=1 
que são iguais entre si porque Viz = V21. Assim, o coeficiente de mn é Vi2 + V21 = 2Vi2. Por 
outro lado, o coeficiente de 1,72 na expressão entre chaves em (5.4.18) é —2k, daí a identificação 
Vi2 = —k. Este tipo de cuidado deve sempre ser tomado ao se comparar a forma padrão (5.3.7) 
com uma lagrangiana específica tal como (5.4.18), caso contrário erros por um fator dois serão 
cometidos que comprometerão todos os resultados subsequentes. 


As frequências dos modos normais são as soluções de 


mg =: 2 = 
det(V = 2) = det ( á ips Es cn ui =0. (5.4.20) 
ou seja, 
2 
(7 + k — mw?) —k? =0 => “ +k—mw?=+k . (5.4.21) 
As frequências características são 
(nu? (9, 2ky1/2 
a= (5) w= (5 + | l (5.4.22) 
e as amplitudes 9) correspondentes são tais que 
2 (1) k —k a” (1) — (1) (1) a 
(V-wiTD) o =0 = k k a 0 oì 05 o ais 
2 
(5.4.23a) 


—k —k 


ay Ap (2) 
(V —u3T) 0 =0 = ( Da == == — 00 =( ae 
2 


(5.4.23) 


onde a e 8 são números reais arbitrários. O modo de freqiiéncia wı corresponde a um movi- 
mento oscilatório dos pêndulos com 1, = 72. Neste caso, tudo se passa como se a mola não 
existisse, pois ela passa todo o tempo com o seu comprimento natural, o que explica o valor 
de wı dado em (5.4.22): ambos os pêndulos oscilam concertadamente com a frequência de um 
pêndulo simples isolado. O segundo modo normal consiste num movimento oscilatório de ambos 
os pêndulos com freqiiéncia w2, porém agora nı = —n>, conforme a Fig. 5.4.2. 
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Figura 5.4.2: Modos normais de vibração de dois pêndulos iguais acoplados por uma mola. 


As duas soluções reais e linearmente independentes podem ser escolhidas como 


Qh) = ( : p = ( E (5.4.24) 


e a solução geral (5.4.13) toma a forma 


2 
m(t) = 5 Cs) of? cos (wst + 65) = COD cos (wit + 61) + C® cos (wot +2) , (54.25) 
s=1 


2 
m(t) = 5 ol) of cos (wst + ds) = COD cos (wit + di) — CO cos (wot +¢2) . (54.25) 


s=1 


Das condições iniciais (0) = 0, n2(0) = a, mm (0) = ù2(0) = O inferimos 


CD cos oy + CO cos dg =0 , (5.4.26a) 
CY cos 6, — C? cos dp =a , (5.4.26b) 
—w1 CD sin di — w2 C® sin do =0 , (5.4.26c) 
—w, C sin dy +w2C) sin do = 0 (5.4.26d) 
Somando as duas primeiras e as duas últimas das Eqs.(5.4.26) deduzimos 
CY cos by = —C®) cos do = a/2 , (5.4.27a) 
CY sing = C® sin dg =0 , (5.4.27) 


Não é admissível ter-se CD) = 0 ou CC) = 0 porque isto geraria uma contradição com (5.4.27a). 
Logo, sin dy = sin ¢2 = 0, cuja solução mais simples é ¢, = ¢2 = 0, em decorrência da qual 
CY) =-c® = a/2. Finalmente, a solução das equações de movimento escreve-se 
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m(t) = 5 (cos wt — cos wat) , (5.4.28a) 
no(t) = 5 (cos wit + cos wat) , (5.4.28) 
com w e wz dadas por (5.4.22). E 


5.5 Coordenadas Normais 


A existência de n modos normais de vibração com frequências w1,...,wn associados 
à lagrangiana (5.3.8) sugere que ela seja equivalente à lagrangiana de um conjunto de 
osciladores harmônicos independentes, cada um deles com freqiiéncia igual a uma das 
frequências características. Isto, no entanto, não está explícito na lagrangiana (5.3.8), pois 
as coordenadas 11,...,%, estão misturadas umas com as outras, resultando nas equações 
de movimento acopladas (5.3.14). Deve ser possível introduzir novas coordenadas em 
lugar dos n's que eliminem todos os termos cruzados na lagrangiana (5.3.8), reduzindo-a 
a uma soma de lagrangianas de osciladores harmônicos independentes. Tais coordenadas 
sempre existem, e passaremos a expor como elas podem ser obtidas em geral. A fim de 
permitir que a exposição flua suavemente, sem constantes interrupções, as demonstrações 
das hipóteses ou afirmações matemáticas que necessariamente surgirão ao longo do texto 


serão realizadas na próxima seção. 


Introduzindo a notação matricial 


m 
n= |:  m=(m.m), (5.5.1) 
Nn 
a lagrangiana (5.3.8) escreve-se 
l.P. 1 r 
L=5n Tn-5n Vn. (5.5.2) 
Defina novas coordenadas ¢,...,¢, relacionadas com n, ..., m pela transformação linear 


n=AC, (5.5.3) 
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onde A é uma matriz a ser determinada. Substituindo (5.5.3) em (5.5.2) resulta 


he oa 
L=56 ATTAÇ- CAT VAÇ (5.5.4) 


Portanto, para que a lagrangiana não contenha acoplamentos entre as coordenadas ¢1,...,Cn 
é necessário que as matrizes A’ TA e A’ VA sejam ambas diagonais. O problema, 
portanto, consiste na busca de uma matriz A capaz de diagonalizar simultaneamente as 


matrizes T e V. 


A introdução de um produto interno no espaço vetorial formado pelas matrizes-coluna 
de n componentes reais facilita a construção da matriz A com os requisitos desejados. 


Defina, portanto, o produto interno (n, €) por 


(7,6) =n TE =X Tumê. (5.5.5) 
kl 


Se @,...,@™ são soluções linearmente independentes de (5.4.8), imponhamos a esses 
vetores a exigência adicional de que eles sejam escolhidos mutuamente ortogonais e nor- 


malizados segundo o produto interno recém-definido: 
(of o ade Hy WSS ile. ga. (5.5.6) 
Defina, agora, a matriz modal A = (Ay) por 
Agr = of” , (5.5.7) 
donde? 


( oD 9 ... dm 
A= | | | E (5.5.8) 


isto é, a p-ésima coluna de A é o vetor @®). As equações (5.5.6) equivalem a 


3 Aqui adotamos a notação e a terminologia de Fetter & Walecka (1980). 
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Ea Tao” = dus (5.5.9) 
kl 


que pinda podem ser reescritas na forma 


oA ee (X Tu Ais) = X (A7) (T A)ks = Ore (5.5.10) 


Usando novamente a definição de produto de matrizes somos conduzidos a 


ATTA =l. (5.5.11) 


A matriz modal (5.5.8) reduz a matriz T à forma diagonal mais simples possível — a 


matriz identidade. Resta verificar se a matriz V é também reduzida à forma diagonal. 


Em componentes, as equações (5.4.8) escrevem-se 
Vad e DAS To 35i 
5 kl O] ws >, kl O] (5.5.12) 
l l 
ou, tirando partido de (5.5.7), 


(VA = (TA). (5.5.13) 


Defina a matriz diagonal W? = (W,s) por 


W,s = w? ôrs , (5.5.14) 
isto é, 
w? 0 0 
0 we 0 
w? = i (5.5.15) 
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A Eq.(5.5.13) pode ser reescrita na forma equivalente 


(VA) = S(T A) gw? Ors = X(T A) kr (WP)rs , (5.5.16) 
ou seja, 
VA = TAW”. (5.5.17) 


Multiplicando esta equação pela esquerda por A” e utilizando (5.5.11) obtém-se, final- 


mente, 


A'VA=W?, (5.5.18) 


completando a demonstração de que A também reduz V a forma diagonal. 


Em termos das coordenadas normais G,... Gn definidas por (5.5.3) a lagrangiana 


(5.5.2) toma a forma simplificada 


b= 5b Swe ay (E ut) , (5.5.19) 
k=1 


que descreve um conjunto de n osciladores harmônicos independentes com frequências 
angulares w1,...,wn, respectivamente. A equação de movimento para cada coordenada 


normal é simplesmente 


d a OL 


TJT = ¢ e p= lisos 52 
Reet og oe pts Phere. (5.5.20) 


cuja solução geral é 


G) =C cos (wt +) , j=1,..n. (5.5.21) 
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Cada modo normal de vibração consiste num movimento do sistema em que apenas uma 
das coordenadas normais oscila harmonicamente, todas as demais permanecendo identi- 
camente nulas. Finalmente, a expressão das coordenadas normais em função das coorde- 
nadas originais m1,...,Mm pode ser imediatamente encontrada por inversão da Eq.(5.5.3): 


multiplique-a pela esquerda por A’ T e use (5.5.12) para obter 


C =A Th. (5.5.22) 


E Exemplo 5.5.1. Determinar as coordenadas normais para os pêndulos acoplados do Exem- 
plo 5.4.1. 


Solução. As duas soluções linearmente independentes das Eqs.(5.4.8) no caso dos pêndulos 
acoplados são 


malt | l (a) , QBER, (5.5.23) 


obtidas no Exemplo 5.4.1. A fim de construir a matriz modal é necessário que o® e o® 
constituam um conjunto ortonormal segundo o produto escalar definido pela matriz T = ml, 
isto é, 


oTo =1 => ma?(1 1) ( : =1 => me=l, (5.5.24a) 


o To =1 => m6? ( oa) ) ( E =1 = mP=l, (5.5.24b) 
(po) = ae a fies 
e Te) =1 => mag(1 1) 4 )=9 = map(1-1)=0. (55.240) 


Portanto, a condição de ortogonalidade é identicamente satisfeita, ao passo que a escolha a = 
B= (2m)-V/ 2 garante a normalização dos vetores, dando lugar a um conjunto ortonormal de 
soluções de (5.4.8) na forma 


1 1 1 1 
(CL) = = (2)ree 
o = (1) = (A) pee) 


resultando na matriz modal 
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Figura 5.5.1: Modelo simplificado para o estudo das vibrações de uma molécula triatômica 
linear e simétrica. 


1 
Ages a): (6.5.26) 
As coordenadas normais sao 
1 1 nı 
= AT T= 5.5.27 
c n ra (5.5.27) 


isto é, 


a= [eon +m) , Q= [em —12) . (5.5.28) 


O modo normal de freqiiéncia wı tem m = m, de maneira que somente ¢, oscila, ¢2 sendo 


identicamente nula; o oposto ocorre com o modo normal de frequência we. E 


Como última ilustração, consideremos um sistema de interesse em espectroscopia 


molecular. 


E Exemplo 5.5.2 Determinar os modos normais de vibração de uma molécula triatômica 
linear e simétrica (por exemplo, CO2) representada pelo modelo da Fig. 5.5.1. 


Solução. A energia potencial é dada por 


= a 0? + Ë (as Oe. (5.5.29) 


=a 
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donde 


lo — T1 = £ 3 T3 — T2 = £ ; (5.5.31) 


como seria de se esperar. Para tornar nosso formalismo aplicável ao presente problema, é 
necessário eliminar da energia potencial termos lineares nas coordenadas generalizadas. Isto 
pode ser conseguido definindo 


m=n+L , m=T , m=T-L, (5.5.32) 
de modo que 
m. ; M. mM. ; M. k 
L= > (iiti) + 82 V = St +8) + Sms l- m)? + (mm). (5-5-33) 
Por inspeção identificam-se 
m O 0 k -k 0 
T=| 0M 0 , V=| -k 2k kl. (5.5.34) 
0 Om O -k k 
A equação característica escreve-se (pondo À = w?) 
k — mA —k 0 
det(V — AT) = det —k 2k — MA —k =0, (5.5.35) 
0 —k k—mxX 
donde 
(k — mA) [ (2k — Md)(k — mA) — k?] — k? (kK-— md) = 0. (5.5.36) 


Uma raiz imediata é À = k/m e as demais são as soluções de 


mM \*—k(2m+M)A\=0. (5.5.37) 


de sorte que as frequências dos modos normais são 
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k k 2 
w=0 , =, w= (1450). (5.5.38) 


À primeira frequência característica à primeira vista pode parecer estranha, pois não corresponde 
a movimento oscilatório, a coordenada normal associada obedecendo à equação 6 = 0. Esta 
frequência nula deve-se à possibilidade de a molécula transladar-se rigidamente sem mudança 
na energia potencial. Como a força restauradora contra tal deslocamento é nula, a frequência 
correspondente é zero. Matematicamente, isto corresponde ao fato de a forma quadrática asso- 
ciada à energia potencial não ser positiva definida. Com efeito, V = 0 para m = m = 73 = 0, 
indicando que a energia potencialí não é mínima na posição de equilíbrio, o qual não é estável 
mas indiferente: um deslocamento rígido da molécula não está sujeito a nenhuma força tendente 
a restaurar o equilíbrio nem a afastar a molécula de sua configuração original. A amplitude 9) 
associada à frequência wı = O satisfaz 


k —k 0 Qj 1 
(V-T) =0 = | -k 2k -k oo) |=0 = gdD=4[1 
O -k k of) 1 
3 
(5.5.39) 
Procedendo de forma andloga encontramos 
1 1 
0?) =B 0 , 0) =C] -2m/M |. (5.5.40) 
= —1 


Os modos normais de vibração estão representados esquematicamente na Fig. 5.5.2. Somente 
os modos 2 e 3 correspondem a vibrações da molécula, o modo número 1 consistindo numa 
translação rígida uniforme. Os vetores g(*) estão associados a frequências distintas, logo são 
automaticamente ortogonais no produto interno (5.5.5), como será demonstrado genericamente 
na próxima seção. À condição de normalização é 


2 2 2 
o& To) = Too =1 => mo +0") + Mo =1, k=1,2,3, (5.5.41) 


rs 


de modo que os vetores normalizados podem ser escolhidos como 


1 1 
1 1 1 
er | = 0 (3) — 2m/M 
É vV2m + M 1 Ke v2m | _4 Rai vV2m(1 + 2m/M) a 
(5.5.42) 


4Uma forma quadrática não-negativa que se anula para valores diferentes de zero das variáveis é dita 
positiva semidefinida. 
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Com a ajuda da matriz modal 


(e 02) 9) 
ee | | | ) , (5.5.43) 


as coordenadas normais escrevem-se € = AT Tn, donde, por exemplo, 


mn, + Mm + mm max, + Mas + mas 1/2 
= = = (2m+ M x ; 5.5.44 
1 Im + M 3m + M ( ) tom ( ) 


Não havendo forças externas, o centro de massa move-se com velocidade constante (žem = 0), 


justificando a frequência wı = O associada a 4. E 


Outros exemplos mais complexos de vibrações moleculares podem ser encontrados 
em (Landau & Lifchitz 1966). Para uma discussão detalhada e geral do problema das 
oscilações amortecidas e forçadas, que não trataremos aqui, uma excelente referência é 
(Gantmacher 1970). 


5.6 Suplemento Matemático 


Nesta seção apresentamos as demonstrações que, para evitar a quebra da continuidade 
da exposição, foram omitidas nas seções anteriores. Chamamos a atenção também para a 
validade em geral de certas propriedades encontradas nos exemplos escolhidos para ilustrar 


a teoria. 


A energia cinética de qualquer sistema físico é sempre positiva, e só é zero se todas a 


velocidades forem nulas, propriedade que, matematicamente, exprime-se por 


SS Tee 20 Vie En ER e X Tee =0 4 Ge sgs0. (5.6.1) 
kl kl 


Esta propriedade de positividade e a simetria da matriz T, isto é, Ta = Ty, permitem 


demonstrar que (5.5.5) tem todas as propriedades de um produto interno, a saber: 


(i) (n,a€ + BE) =a(n,€)+ B(n,€) , a,ßER (linearidade) ; (5.6.2a) 
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(ii) (m,€) = (€, n) (simetria) ; (5.6.2b) 


(iii) (n,n) >0 e (n,n)=0 <> n=0 (positividade) . (5.6.2c) 


m Exercício 5.6.1. Prove que (n,é) definido em R” por (5.5.5) goza das propriedades 


(i) — (iii) que caracterizam um produto interno. E 


Tacitamente admitimos que todas as soluções para w? da equação característica (5.4.6) 
são positivas, acarretando que as frequências w1,...,w São reais e positivas. Isto pode ser 
facilmente demonstrado explorando a positividade da matriz V. Seja \ = w? e suponha 


que 


VE=ATE (5.6.3) 


com € #0. Multiplicando esta última equação por £" e resolvendo para A resulta 


E VE 


\= ETTE 


>0 (5.6.4) 


porque tanto o numerador quanto o denominador são positivos em virtude das Eqs.(5.3.7) 
e (5.6.1). 


No Exemplo 5.5.1 os modos de frequências wı e wz eram automaticamente ortogonais 
no produto interno (5.5.5). Isto não é uma ocorrência fortuita, mas tem lugar sempre que 
as frequências são distintas. De fato, sejam 0 e @) soluções de (5.6.3) com diferentes 


valores de À: 


Ve -NToD: (5.6.5a) 


Vo) = »To?. (5.6.5b) 


Multiplicando (5.6.5a) pela esquerda por 02” , (5.6.5b) por od” e subtraindo as equações 


resultantes obtém-se 


T T 
(Ar — A2)(0, 2) = o” Vo — o™ Vo® , (5.6.6) 
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onde usamos a simetria do produto interno (5.5.5). Mas, como V é também matriz 


simétrica, o Exercício 5.6.1 estabelece que 


T T 
e Ve = pT vo? . (5.6.7) 


Conseqiientemente, 


(1 — 2) (0,0) =0 = (00,9%) =0 (5.6.8) 


se Ay Æ À». Se todas as frequências forem distintas, as soluções linearmente independentes 
de (5.4.5) serão automaticamente ortogonais entre si, bastando normalizá-las no produto 
interno (5.5.5) para se construir a matriz modal. Se o espectro de frequências for degen- 
erado, isto é, se a equação característica (5.4.6) possuir raízes múltiplas, será necessário 
escolher combinações lineares convenientes das soluções linearmente independentes de 


(5.4.5) de modo a se obter um conjunto de vetores mutuamente ortogonais. 


Finalmente, outra suposição feita para permitir escrever a solução geral das equações 
de movimento na forma (5.4.13) foi a da existência de exatamente n soluções linearmente 
independentes @,..., o™ da Eq.(5.4.5). A fim de demonstrar isto, notemos inicialmente 
que a positividade da matriz T assegura a existência de sua inversa T~'. Com efeito, 
se T não tivesse inversa existiria um vetor € # 0 tal que TẸ = 0. Multiplicando esta 
última equação pela esquerda por €” seríamos levados a concluir que (€,€) = 0 donde 


€ = 0, o que vem a ser uma contradição. Escrevamos, portanto, a Eq.(5.4.5) na forma 


TIVE = AAE, (5.6.9) 


que é a equação de autovalores e autovetores para o operador K = T~! V. De acordo 
com o Teorema C.13, demonstrado no Apêndice C, se provarmos que K é simétrico estará 
provado que K é auto-adjunto e assegurada a existência de uma base ortonormal de R” 
(e, portanto, de uma coleção de n vetores linearmente independentes) constituída por 
autovetores de K. Por outro lado, para provar que um operador é simétrico basta verificar 
que sua matriz associada numa base ortonormal arbitrária €D,...,€0M) é simétrica. Mas, 


por definição, os elementos de matriz de K são 
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K; = (€0 Ke) = EO ppl ye) — EO vel) (5.6.10) 


donde, usando a Eq.(5.6.7), infere-se imediatamente que K;; = Kj. Fica, portanto, 
estabelecida a asserção feita na Seção 5.4 de que é possível encontrar n soluções linearmente 
independentes da Eq.(5.4.5). 


Como último comentário, note que a positividade da matriz V não foi utilizada na 
demonstração de que a matriz modal diagonaliza simultaneamente T e V. Assim, de um 
ponto de vista estritamente matemático, provamos que, dadas duas formas quadráticas 
reais, basta que uma delas seja positiva definida para que exista uma matriz capaz de 
diagonalizá-las simultaneamente. Essa diagonalização simultânea é geometricamente vi- 
sualizável sem dificuldade no caso de sistemas com apenas dois graus de liberdade (Aravind 
1989). 


PROBLEMAS 


5.1. Uma partícula de massa m move-se no semi-eixo x > 0 com energia potencial 


V(x) =Vo(e*? + Cz) , 


onde todas as constantes sao positivas. Determine para que valores das constantes existem 
posições de equilíbrio e encontre a freqiiéncia das pequenas oscilações em torno das posições 


de equilíbrio estável. 


5.2. Um pêndulo duplo genérico tem a lagrangiana dada no Problema 1.2. Considere 
pequenas oscilações no caso particular 4 = %2 = l, mı =m, M = 3m. (i) Determine os 
modos normais de vibração e represente-os graficamente.(ii) Encontre a posição de cada 
partícula no instante t se em t = 0 ambas estavam em repouso deslocadas do mesmo 


ângulo pequeno fọ em relação à vertical. (iii) Obtenha as coordenadas normais do sistema. 


5.3. Uma partícula move-se sem atrito na parte interna côncava de uma superfície de 
revolução z = f(p), onde p,0,z são coordenadas cilíndricas, e na presença de um campo 


gravitacional constante g = —gk. (i) Encontre a condição para que exista uma órbita 
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Figura 5.6.1: Problema 5.4 


circular de raio po. (ii) Mostre que uma órbita circular é estável ou instável conforme 
3f'(po) + pof"(po) seja positivo ou negativo. (iii) Para as órbitas estáveis, encontre a 
frequência Q das pequenas oscilações em torno da configuração de equilíbrio. (iv) Aplique 
os resultados anteriores à superfície z = —/R2-p2, p < R. Relacione a velocidade 


angular w da partícula com com o raio pọ da órbita e determine a razão 0?/w?. 


5.4. O sistema representado na figura está sobre uma mesa horizontal lisa. Todas as 
molas são iguais e a haste rígida homogênea AB tem massa m e comprimento 2/. 
Não há movimento da haste na direção y. Usando como coordenadas a abscissa x do 
centro de massa da haste e o ângulo 6 que ela forma com o eixo y, determine: (i) 
a lagrangiana; (ii) as frequências características e os modos normais de vibração. (iii) 


Represente graficamente os modos normais. 


5.5. Duas partículas de mesma massa m estão ligadas entre si por uma mola de cons- 
tante elástica k’ e por molas de mesma constante elástica k a dois suportes fixos. Na 
posição de equilíbrio as molas têm todas o mesmo comprimento natural e o movimento 
está restrito a uma linha reta. (a) Determine as frequências características e os modos 
normais de vibração do sistema. (b) Justifique fisicamente o valor da menor frequência 
característica. (c) Represente graficamente os modos normais de vibração. (d) Obtenha 
a matriz modal e as coordenadas normais. Verifique explicitamente que as coordenadas 
normais diagonalizam a lagrangiana. (e) Encontre a posição de cada partícula no instante 
t dadas as seguintes condições iniciais em t = 0: (i) ambas as partículas na posição de 
equilíbrio, a primeira com velocidade vg e a segunda em repouso; (ii) ambas as partículas 
em repouso, a primeira na posição de equilíbrio e a segunda deslocada de a. No caso (ii), 


descreva qualitativamente o movimento de cada partícula se k < k. 
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Figura 5.6.2: Problema 5.6 


5.6. Um aro fino de massa m e raio R oscila num plano vertical com um ponto fixo O 
(ver figura). Ao longo do aro desliza sem atrito uma conta com a amesma massa m. (i) 


Mostre que a lagrangiana do sistema é 


3mR? . R?. E 
= T 6? 4 5 02 + mR? 61 0z cos(01 — 05) + 2mgR cos 6, + mgR cos 0» 


L 


(ii) Considerando pequenas oscilações, encontre as freqüências características e os modos 
normais de vibração. Represente graficamente os modos normais. (iii) Obtenha a solução 
das equações de movimento com as condições iniciais 0;(0) = 0, 05(0) = 06, 6,(0) = 


6(0) = 0. (iv) Determine a matriz modal e as coordenadas normais do sistema. 


Capitulo 6 


MECANICA RELATIVISTICA 


I am convinced that the philosophers have had a harmful effect upon the progress 
of scientific thinking in removing certain fundamental concepts from the domain of 
empiricism... This is particularly true of our concepts of time and space, which 
physicists have been obliged by the facts to bring down from the Olympus of the a 
priori in order to adjust them and put them in a serviceable condition. 


Albert Einstein 


Quando as partículas movem-se com velocidades próximas à velocidade da luz no vacuo 
a mecânica newtoniana entra em contradição com a experiência e precisa ser reformulada 
à luz da teoria especial da relatividade. Suporemos previamente conhecidas as bases 
físicas da teoria special da relatividade (Bergmann 1975; Rindler 1982) bem como as 
transformações de Lorentz e suas consequências mais imediatas.! Nossa atenção estará 
voltada para o desenvolvimento de um formalismo que permita formular as leis da Física 
numa forma manifestamente válida em todos os sistemas de referência inerciais, seguido de 
sua aplicação à dinâmica de uma partícula e sua incorporação ao arcabouço da mecânica 


analítica. 


6.1 Transformações de Lorentz 


Seja K um referencial inercial e K’ um outro referencial inercial que se move em 
relação a K com velocidade v ao longo da direção x de K (os eixos de K” são paralelos aos 


eixos de K ). Suponhamos que as origens O e O’ coincidam nos instantes t = t = 0. Então 


lOs principais trabalhos originais podem ser encontrados em Lorentz, Einstein, Minkowski & Weyl 
(1952). 
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Figura 6.1.1: Transformação de Lorentz. 


as coordenadas (x,y, z,t) e (x',y',2',t') atribuídas a um mesmo evento por observadores 


fixos nos respectivos referenciais estão relacionadas por 


pe (6.1.12) 
V1— v2/c2 
y=y, (6.1.16) 
ae (6.1.1c) 
_ 2 
ge (6.1.1d) 


yi2 


As equações (5.6.1) constituem uma transformação de Lorentz e foram deduzidas por 
Einstein em 1905 com base no postulado fundamental da constância da velocidade da luz 
no vácuo.? Formalmente, o limite não relativístico da transformação de Lorentz obtém-se 


fazendo c — oo. De fato, passando ao limite c > œ a Eq.(6.1.1) reduz-se a 


TS. , y=y PER , =t, (6.1.2) 


que é uma transformação de Galileu, característica da mecânica newtoniana. 


É fácil e conveniente generalizar (6.1.1) de modo a eliminar a particularidade da escolha 


da velocidade v paralela à direção x. Em termos de v = vi é claro que 


?Embora a transformação de Lorentz (6.1.1) já fosse conhecida e empregada por Lorentz antes de 1905, 
coube a Einstein deduzi-la e interpretá-la de forma revolucionária. 
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VL=Vr, (6.1.3) 
onde r = (x,y,z) é o vetor posição referente a K. Por outro lado, definindo 
y=(1=v/P Vo , B=v/e (6.1.4) 


podemos escrever a parte espacial de (6.1.1) na forma vetorial 


r=rt(y-Dei-syvt=r+gy- DL Lowe, (6.1.5) 
v v 


onde usamos (6.1.3). Finalmente, as Eqs.(6.1.1) podem ser postas na forma 


r =r- DÉB- yepi l (6.1.6a) 


(6.1.6b) 


que não faz menção a n nhuma direção privilegiada para v = cf. 


O intervalo ds entre dois eventos infinitesimalmente próximos, com coordenadas 


(x,y,z,t) e (x + dz,y + dy, z + dz,t + dt) respectivamente, é definido por? 


d? = ê d? — do — dy? — dz? . (6.1.7) 


Das Eqs.(6.1.1) deduzimos 


dx’ = y (dz — vdt) , dy'=dy , dz =dz , dł =~ y(dt—vdz/c’) , (6.1.8) 


e um cálculo algébrico simples mostra que 


3Esta definição não é universal. Muitos autores preferem escrever ds? = —c? dt? + dx? + dy? + dz?, 
de modo que é preciso atentar para as convenções utilizadas antes de comparar fórmulas de diferentes 
autores. 
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ds? = ds’ (6.1.9) 


Este é um importante resultado: o intervalo entre dois eventos é invariante sob trans- 
formações de Lorentz.* Naturalmente, o mesmo resultado vale para um intervalo finito 
As. Note que ds é análogo à distância entre dois pontos infinitesimalmente próximos 
num esp!co euclidiano tridimensional. No entanto, no caso da teoria especial da relativi- 
dade nem a distância espacial nem o intervalo de tempo são separadamente invariantes, 
mas somente a particular combinação de espaço e tempo expressa em (6.1.7).º O espaço- 
tempo quadridimensional com “distância” invariante ds definida por (6.1.7) é conhecido 


com espaço de Minkowski. 


De agora em diante faremos uso da seguinte notação indicial: 


SCE Eds PRE TE (6.1.10) 


A transformação de Lorentz (6.1.6) é uma transformação linear que pode ser escrita na 
forma 
a = Aor? AM at AS Ata = A, 2”, (6.1.11) 


onde passamos a utilizar a convenção de soma sobre índices repetidos de Einstein: toda 
vez que um índice aparecer repetido, tal como v nesta última equação, deve-se efetuar 
uma soma de O a 3 sobre tal índice. Convencionaremos, também, que índices gregos tais 
como a, 3, |, v,... assumem os valores 0,1,2,3, ao passo que índices latinos tais como 
i,j,k,l,... tomam os valores 1,2,3. Os A”, são os coeficientes da transformação de 
Lorentz e constituem uma matriz A = (A“,) chamada de matriz da transformação de 
Lorentz. Por exemplo, no caso da transformação de Lorentz ao longo da direção x a 


matriz associada é 


y HGy O0 

2) -86y y 00 
A= ; a: hig (6.1.12) 

0 0 01 


4Diz-se, também, que ds é um escalar de Lorentz. 

5Daí a célebre e dramática frase de Minkowski ao apresentar essas idéias pela primeira vez em 1908: 
“De ora em diante o espaço por si mesmo e o tempo por si mesmo estão fadados a desvanecer-se em meras 
sombras, e apenas uma espécie de união dos dois preservará uma realidade independente.” 

“Em At, o indice de linha é u e o índice de coluna é v. 
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E Exercício 6.1.1. Prove que os elementos da matriz A são 


i Bi Bj 
A; = 6 +(y-—1) Bz f (6.1.13b) 
no caso da transformação de Lorentz (6.1.6), em que a direção de v = c 8 é arbitrária. E 
A introdução da matriz G , com elementos g,», definida por” 

1 0 0 0 

0—1 0 0 

0 0 0 —1 

permite escrever 

ds? = c? dt? — dz? — dy? — dz? = gw dx" dx” , (6.1.15) 


nesta última equação havendo, conforme convencionado, uma soma dupla nos índices 
repetidos ye v. A matriz G define uma métrica no espaço de Minkowski e seus elementos 


Juv são chamados de componentes do tensor métrico. 


A transformaçãode Lorentz mais geral possível é definida como qualquer transformação 


linear da forma (6.1.11) que deixa ds? invariante, isto é, 


ds? = gu» dx" dx” = ds” = gu dx" da” = gy A” a dae A” pda” , (6.1.16) 


para dx's arbitrários. A fim de poder comparar os coeficientes dos deslocamentos em 
ambos os lados de (6.1.16), note que (vide Apêndice A) 


Juv dx" dx” = gua dx* dz? . (6.1.17) 


"Muitos autores preferem definir G com os sinais de todos os elementos da diagonal trocados. 
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Assim resulta 


Modu gan dx? = Gagan” dx? , (6.1.18) 


donde, face à arbitrariedade dos dx’s, 


AF a Jw A” g = Jas - (6.1.19) 


Esta é a equação que caracteriza A como matriz de uma transformação de Lorentz. Em 


notação matricial a Eq.(6.1.19) equivale a 


A"GA=G. (6.1.20) 


Multiplicando esta última equação pela direita por G e notando que G? = T , resulta 
A’ GAG = I, o que mostra que A” G é a matriz inversa de AG. Como a inversa de 
uma matriz pela esquerda coincide com a inversa pela direita, temos também AGA” G = 
I , donde 


AGA” =G, (6.1.21) 


que é uma condição equivalente a (6.1.20). Uma transformação de Lorentz é uma espécie 
de rotação no espaço-tempo, e a matriz associada é ortogonal em relação à métrica G do 
espaço de Minkowski. No caso das rotações tridimensionais a métrica é dada pela matriz 


identidade, e a condição correspondente a (6.1.20) é a Eq.(3.1.11). 


Hm Exercício 6.1.2. Usando (6.1.20) e (6.1.21) prove que o conjunto das transformações de 
Lorentz forma um grupo, chamado de grupo de Lorentz. Sugestões: (i) a definição de grupo está 
no final da Seção 3.1; (ii) se G e H são matrizes inversíveis então (GH) ! = H7! G7! ; (iii) 


a transposta da inversa é igual à inversa da transposta. E 


Vale ressaltar que a definição (6.1.20) de transformação de Lorentz abrange uma classe 


muito mais ampla de transformações lineares do que as transformações de Lorentz puras da 
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forma (6.1.6). Por exemplo, uma rotação dos eixos espaciais constitui uma transformação 
de Lorentz consoante nossa definição geral, pois não afeta o tempo e deixa invariante a 
distância espacial entre dois pontos. A inversão espacial t = t, r’ = —r e a inversão 
temporal = —t, r' = r também constituem exemplos de transformações de Lorentz, 


pois ambas preservam ds? . 


As principais propriedades das transformações de Lorentz podem ser inferidas de 
(6.1.19) ou (6.1.20). Tomando o determinante de (6.1.20) deduzimos 


—1 = det G = det (AT G A) = det AT det G det A = (det A) (—1) (det A) , (6.1.22) 


isto é, 
(det A)? =1 = detA=+1. (6.1.23) 


Uma transformação de Lorentz com determinante +1 é dita própria, e é dita imprópria se 
o determinante é —1. Qualquer transformação de Lorentz pura, tal como (6.1.1), é própria 


(verifique!). 


Tomando a= 8 = 0 em (6.1.19) obtém-se 


1 = goo = A” o uv A” 0 = (AP oF — (Ao)? — (A20) — (APG), (6.1.24) 


ou seja, 


(A° 9)? = 1 + (Ao)? + (AO) + (AO) DI, (6.1.25) 


donde, finalmente, 


A> +1 ou GA Sr, (6.1.26) 


Se Aº9 > +1 a transformação de Lorentz é dita ortócrona (preserva o sentido do tempo); 
se A°g < —1 atransformaçãode Lorentz é dita não-ortócrona (inverte o sentido do tempo). 


Qualquer transformação de Lorentz pura, que conecta referenciais com eixos paralelos e 
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em movimento relativo com velocidade constante, é ortécrona.® Uma inversão temporal 
é uma transformação de Lorentz não-ortócrona. As transformações próprias e ortócronas 
são chamadas de transformações de Lorentz restritas. As transformações de Lorentz 
infinitesimais desempenham um papel muito importante no estudo das propriedades do 
grupo de Lorentz. Uma transformação de Lorentz infinitesimal é necessariamente restrita 
porque só difere infinitesimalmente da transformação identidade, que é própria e ortócrona, 
e uma variação infinitesimal não pode provocar um salto finito nem em A°9 nem no 
determinante de A. Portanto, somente as transformações de Lorentz restritas podem 
ser construídas por aplicação de sucessivas transformações de Lorentz infinitesimais. A 
presente discussão estabelece que o grupo de Lorentz se decompõe em quatro setores 


disjuntos. 


Setores do Grupo de Lorentz 


L! : dtA=+1 e CA GET 


Ly : det A = +1 e Nai 


L! : dtA=-1 e A% 


Lj : dettA=-1 e A<- 


O conjunto da transformações de Lorentz restritas LI é o único setor que forma um 


subgrupo do grupo de Lorentz. Este subgrupo é chamado de grupo de Lorentz restrito. 


A única parte não trivial da demonstração de que po constitui um grupo é a verificação 
de que o produto de duas matrizes de Lorentz ortócronas é também uma matriz ortócrona. 
Sejam A e A duas transformações de Lorentz ortócronas consecutivas e seja A =A A. Então 
i", = Av, A%,, de modo que 


No = AM AP + AA! o + AP A* 9 + A.A? 0 (6.1.27) 


Pondo a = (A®,,A°,,A°3), b = (Ato, A?0, A30) e usando (6.1.25) bem como sua análoga 
decorrente de (6.1.21), ficamos com 


A,=virevi+B+a-b. (6.1.28) 


onde a= |a| e b= |b|. Mas 


SAs transformações de Lorentz puras também costumam ser chamadas de “boosts”. 
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Figura 6.2.1: Cone de luz do evento O. 


vVl+alvi+b2 = VI +a? +b? + a?b? = VCL + ab)? + (a — b)? >1+ab, (6.1.29) 


donde 7 
Ag>l+ab+a-b. (6.1.30) 


Í x z0 ; 
Levando em conta que a-b > —ab, obtemos imediatamente A 5 > 1, como queríamos demons- 


trar. 


6.2 Cone de Luz e Causalidade 


Um intervalo As? = c? At? — Ax? — Ay? — Az? entre dois eventos é dito do tipo espaço 
se a parte espacial é maior do que a parte temporal (As? < 0), e do tipo tempo se a 
parte temporal é maior do que a parte espacial (As? > 0). Se As? = 0 o intervalo é dito 
do tipo luz . Note que esta classificação dos intervalos é absoluta, em outras palavras, é 


válida em todos os referenciars inerciais porque As? é um escalar (invariante). 


Considere, agora, um evento O e tome-o como origem de um referencial inercial K. Na 


0 — ct o eixo horizontal está representando coletivamente 


Fig. 6.2.1 0 eixo vertical indica x 
os três eixos espaciais x,y,z. As retas A e B, inclinadas de 45º relativamente aos eixos 
coordenados, representam as linhas de universo (trajetórias no espaço-tempo) de raios 
luminosos viajando em direções opostas, mas cuja emissão constitui o evento O. As linhas 


de universo dos raios luminosos em toda as direções, cuja emissão corresponde ao evento 
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Figura 6.2.2: Representação de uma transformação de Lorentz por um diagrama de 
Minkowski. 


O, formam um cone com vértice em O, o chamado cone de luz de O, que divide o espaço- 
tempo em quatro regiões. A região J é chamada de futuro absoluto de O e um evento 
E de I está separado de O por um intervalo do tipo tempo. A magnitude da projeção 
a: 
horizontal de um vetor como OE; é a distância espacial entre os eventos, ao passo que 
a projeção vertical é cAt, onde At é o intervalo de tempo entre os eventos. Note que 
cAt é a distância percorrida por um raio luminoso durante o intervalo de tempo entre 
os eventos. Como a distância espacial entre os eventos O e Er é menor do que c vezes 
o intervalo temporal que os separa, pode haver uma relação de causa e efeito entre O e 
Er. Por exemplo, o evento O poderia representar uma explosão e o evento E; representar 
a chegada do estrondo produzido pela explosão. A região II é o passado absoluto de O, 
e pode haver uma relação de causa e efeito entre Err e O. Por outro lado, é impossível 
haver conexão causal entre O e um evento nas regiões III ou IV. Por exemplo, a distância 
percorrida pela luz no intervalo de tempo entre os eventos O e Ery é menor do que a 
separação espacial entre eles, de modo que para haver relação de causa e efeito entre O 
e Ery seria necessário existir algum processo físico capaz de propagar-se com velocidade 


superior à velocidade da luz no vácuo, o que é proibido pela teoria especial da relatividade. 


Representações gráficas do espaço-tempo como a da Fig. 6.2.1, conhecidas como dia- 
gramas de Minkowski, são úteis para ilustrar algumas das principais propriedades das 
transformações de Lorentz. Representemos por eixos mutuamente perpendiculares as 
coordenadas x°=ct e x do sistema de referência K, como na Fig. 6.2.2. Consideremos 
agora o sistema K” que se move em relação a K com velocidade v ao longo da direção z. 
A reta 2’ = 0, que corresponde ao eixo x? de K’, satisfaz a equação v=xº com B=v/c, 


0 


como se deduz de (6.1.1). Portanto, o ângulo ¢ entre os eixos x” e x’? é menor do que 45º 
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Figura 6.2.3: Diagramas de Minkowski. 


porque tan ¢=( < 1. Analogamente, o eixo x’ é definido por x” =0 e corresponde, pela 
Eq. (6.1.1), à reta x° = Gx, que faz o mesmo ângulo ¢ com o eixo x°. Uma transformação 


° x) para os eixos 


de Lorentz corresponde a uma transição dos eixos perpendiculares (x 
inclinados (2"°, z’). As coordenadas de um evento são obtidas traçando-se linhas paralelas 
aos respectivos eixos coordenados. Por intermédio desses diagramas é simples perceber 
a relatividade da simultaneidade, uma característica marcante da relatividade especial. 
Dados dois eventos espacialmente separados P e Q que são simultâneos em K’, eles não 
são simultâneos em K, como a Fig. 6.1.2 mostra claramente. Por outro lado, se R é um 
evento separado de O por um intervalo do tipo espaço, existe um referencial inercial no 


qual os eventos O e R ocorrem no mesmo instante. 


A linha de universo de uma partícula é representada no diagrama de Minkowski por 
uma curva, como ilustra a Fig. 6.2.3(a). A curva não é arbitrária, no entanto, porque 
de dx/dxº = 8 < 1 conclui-se que a tangente à linha de universo da partícula faz um 
ângulo 0 com o eixo dos tempos sempre menor do que 45º. Se a trajetória da partícula no 
espaço-tempo contiver o evento O, sua linha de universo estará inteiramente contida no 
cone de luz do evento O. A linha de universo de um raio luminoso é uma reta inclinada 
de 45º em relação aos eixos coordenados. Como exemplo da utilidade dos diagramas 
do espaço-tempo, mostremos de outra maneira a impossibilidade de conexão causal entre 
eventos separados por um intervalo do tipo espaço. Na Fig. 6.2.3(b) suponha que O 
represente a emissão e P a recepção de um hipotético sinal capaz de propagar-se em K 
com velocidade superior à da luz no vácuo. Então existiria um referencial K’ em que a 
propagação desse sinal seria instantânea, isto é, sua velocidade seria infinita. Pior ainda, 
haveria um referencial K” no qual o sinal seria recebido antes de ter sido emitido! Apesar 


de sua inegável utilidade, faremos uso desses diagramas apenas ocasionalmente porque, 
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em geral, os argumentos algébricos ou analiticos sao muito mais poderosos. 


6.3 Vetores e Tensores 


O princípio da relatividade afirma que as leis da Física têm a mesma forma em todos 
os referenciais inerciais. A fim de fazer valer este princípio, a expressão matemática das 
leis físicas deve envolver somente quantidades com regras de transformação bem definidas 


quando se passa de um referencial inercial para outro. 


Definição 6.3.1. Um escalar é uma quantidade invariante sob transformações de 


Lorentz, ou seja, cujo valor é o mesmo em todos os referenciais inerciais. 


A carga elétrica de uma partícula, o intervalo entre dois eventos e a velocidade da luz 


no vácuo são exemplos de escalares. 


Definição 6.3.2. Um quadrivetor (ou, simplesmente, vetor) contravariante é um 
conjunto de quatro quantidades (V°,V',V?, V3) que, sob uma transformação de Lorentz, 


transformam-se da mesma maneira que o deslocamento (dxº, dx, dx”, dx?) , isto é, 


VS NV. (6.3.1) 


Em suma, o protótipo de vetor contravariante é o vetor deslocamento da”. 


Teorema 6.3.1. Se V” e W* são vetores contravariantes, então 


gu VYW” = VW — vlw! — V?W? — VêWº = escalar . (6.3.2) 


Este teorema é uma consequência imediata da Eq.(6.1.16), e sua validade sugere in- 


troduzir uma operação de abaixamento de índice definida por 


Va = Jw y” , (6.3.3) 


214 CAPÍTULO 6. MECÂNICA RELATIVÍSTICA 


pois com esta operação a Eq.(6.3.2) assume a forma usual de um produto escalar. 


Definição 6.3.3. O produto escalar de dois vetores contravariantes V” e W!” é 


definido por? 
V-W = VW" = WW? + VW! + VW? + VW? , (6.3.4a) 


com V, dado por (6.3.3). Em particular, 


V? =V.V = (VÌF - (vv) (>. (6.3.4b) 


E Exercício 6.3.1. Prove que 


V W” = VW x (6.3.5) 

Mostre, ainda, que se V” = (V?, V1, V2, V°) então 
Va = (V°,-V',-V?, -V®) , (6.3.6) 
e o abaixamento de indice apenas troca o sinal das componentes espaciais do quadrivetor. E 
É conveniente introduzir os elementos g'” da inversa da matriz G definida por 


(6.1.14). Mas como G~! = G, é imediato que 


ge) = (6.3.7) 


oo OF 


e, evidentemente, 
ger Jov = ds (6.3.8) 


Note, ainda, que g"” e guu São simétricos em seus índices, isto é, 


Neste capítulo, letras maiúsculas da segunda metade do alfabeto, em negrito, serão ocasionalmente 
empregadas para denotar quadrivetores. 


6.3. VETORES E TENSORES 215 


, Juv = Gop - (6.3.9) 


Com a ajuda de g’” definimos a operação de levantamento de indice por 


VE = g” V, . (6.3.10) 


É claro que o abaixamento do índice de um vetor contravariante V” por (6.3.3) seguido 


de um levantamento do índice por (6.3.10) reproduz o vetor V” original. 


Se à é uma função escalar, sua diferencial 


_ O$ 4,0, 2 


_ 3% 
— 8x T “Og! 


“Ou? a da? = 2 


2 
ida Ox? Ort! 


dx! 


do dx“ = escalar . (6.3.11) 


Comparando esta equação com (6.3.4) concluímos que o gradiente de uma função escalar 
é um tipo de vetor distinto do vetor contravariante e sua lei de transformação é idêntica 
à de V, definido por (6.3.3) a partir de um vetor contravariante V”. Vejamos, portanto, 


como se transforma V,,: 


Vi c= Ga QuE = Gi Nag Ve = AVE: (6.3.12) 


one definimos 
Ay? = gu g N a , (6.3.13) 


Definição 6.3.4. Um vetor covariante V, é definido pela lei de transformação 


V'a = A” Vo, (6.3.14) 


onde os coeficientes A,,” são determinados em termos dos elementos da matriz da trans- 
formação de Lorentz por (6.3.13). Em suma, o protótipo de vetor covariante é o gradiente 


de uma função escalar 0, À = 0¢/0x" . 
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Hm Exercício 6.3.3 Fazendo uso das Eqs. (6.1.19) e (6.3.8) mostre que 


Ay? Abs Or, (6.3.15) 


e daí conclua que a matriz (A,,”) é a transposta da inversa de A = (A“,). E 


Definição 6.3.5. Um tensor contravariante de ordem r é um objeto T° com 


4” componentes que, sob uma transformação de Lorentz, transformam-se segundo a regra 


PE NON NOR etn O TORERE (6.3.16a) 


Analogamente, um tensor covariante Za,as..a, de ordem r é definido pela lei de trans- 


formação 


Zra = Aa PO aa Aa as, (6.3.16b) 


Tensores mistos, com índices covariantes e contravariantes, definem-se de modo similar. 


Exemplos de tensores contravariantes de segunda ordem são 


VYW” i, VEW” + VW! , VW” = VW® , (6.3.17) 
onde V” e W* são vetores contravariantes. 
As operações de abaixamento e levantamento de índices são aplicáveis a um ou mais 


índices de tensores de ordem arbitrária: 


Tp” = Jua Ts ; Thy = Iva THS ; (6.3.18a) 


Ty = Jua Jv fia , TH = on g’? Tag : (6.3.18b) 
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O produto escalar de um vetor por um tensor reduz de uma unidade a ordem do tensor. 


Por exemplo: 


V, 7°" = tensor de segunda ordem ; (6.3.19a) 


VY’ = tensor de primeira ordem = vetor . (6.3.19b) 


Verifiquemos, por exemplo, esta última afirmação. Definindo W” = V, Y” e usando a 
Eq.(6.3.14) temos 


W” =V' Y = Ma PE A RE AYA 


= a = a Wer SME, (6.3.20) 


o que comprova o caráter vetorial de W”. 


Uma operação do tipo 


ME ee a Vs (6.3.21) 


é chamada de contração. Assim, por exemplo, T”,º é a contração dos dois primeiros 
índices de VT”. Claramente, a contração reduz a ordem do tensor em duas unidades. 


Por exemplo, no caso de um tensor de segunda ordem T“” o escalar!? 


n=," , (6.3.22) 


é chamado de traco do tensor. 


Notemos, finalmente, que a classificagao de intervalos aplica-se a vetores: 


VaVº>0 <= V” é vetor do tipo tempo ; 


10Um escalar pode ser considerado um tensor de ordem zero. 
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VV’ <0 <> V” é vetor do tipo espaço ; (6.3.23) 


V,V#=0 <> V” é vetor do tipo luz . 


Esta classificação é absoluta porque V, V” é invariante sob transformações de Lorentz. 


6.4 Campos Tensoriais 


Definição 6.4.1. Um campo escalar é uma função (P) cujo valor em cada ponto 
P do espaço-tempo é invariante sob transformações de Lorentz, isto é, ¢'(P) = (P). Se 
0 


o ponto P tem coordenadas x = (x°, £t, 27,7?) em K e x’ em K’ temos 


(a!) = Ha). (6.4.1) 


Definição 6.4.2. Um campo tensorial T“”"?(P) é um tensor associado a cada ponto 


P do espaço-tempo e caracterizado pela lei de transformação 


Pee OT RA SO BEEP) a (6.4.2) 


O operador gradiente quadridimensional 


28. G8 8 BB AS 
On = ~ re 


Vv) (6.4.3) 


Ox (570° Ox!’ Ox?’ 213) 


é um vetor covariante. Isto deduz-se do fato de 0, @ ser um vetor covariante, como vimos 


na Seção 6.3, e da definição de campo escalar. De fato, combinando 


(O) =A,"(¢) ou Fp =A ðG (6.4.4) 


com ¢’ = ¢, concluímos que, como operador, 
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a,=A,"0, , (6.4.5) 


confirmando a asserção inicial. Analogamente, 


o ð ð ð ð 10 


uva — — = Es 
Of = Oy OX (mo Ox,’ dx, Oxs Ore v) (Oe) 


é um vetor contravariante. 


Campos tensoriais podem ter sua ordem aumentada por diferenciagao. Por exemplo, 


se @ é um campo escalar então 


2 


Ou Oy À = Ox# Ox” 


= campo tensorial covariante de segunda ordem . (6.4.7) 


Se TH” é um campo tensorial contravariante de segunda ordem segue-se que 


oºT'” = campo tensorial contravariante de terceira ordem . (6.4.8) 


Havendo contração de indices, por diferenciação pode-se reduzir a ordem de um campo 


tensorial. Por exemplo, se Ft” é um campo tensorial contravariante de segunda ordem, 


9, Ft” = campo vetorial contravariante . (6.4.9) 


Definição 6.4.3. A divergência de um campo vetorial V” é um campo escalar 


denotado por divV e definido por 


div V = ð, V” . (6.4.10) 
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Definição 6.4.4. O rotacional de um campo vetorial V” é um campo tensorial de 


segunda ordem denotado por (rot V)#” e definido por 


(rot V)” = 8V” — 8V" . (6.4.11) 


A divergência do gradiente constitui o operador de d’Alembert ou “d' Alembertiano”, 


que é a versão quadridimensional do laplaciano: 


18 g 2 æ 1 8? 
= da Cop dx dy az “20 Ns One 


Este operador é um escalar, de modo que sua aplicação nao altera a ordem de um campo 


tensorial. 


6.5 Leis Físicas em Forma Covariante 


O aparato tensorial desenvolvido nas seções anteriores tem como objetivo permitir a 
expressão matemática das leis da Física em forma covariante, isto é, válida em todos os 
referenciais inerciais. Suponha que, num dado sistema de referência inercial K, uma lei 


da Física possa ser expressa na forma 


PERS) s (6.5.1) 


onde Tr"? é um tensor ou campo tensorial. Em virtude das leis de transformação 
homogêneas (6.3.16) ou (6.4.2) de suas componentes, se um tensor ou campo tensorial é 
nulo num sistema inercial ele será nulo em todos os demais sistemas inerciais. Em outras 


palavras, num sistema inercial K” teremos 


OE eS). (6.5.2) 


se (6.5.1) valer em K. Em conseqtiéncia, a lei física descrita por (6.5.1) em K tem a mesma 
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forma em todos os referenciais inerciais. Dizemos que uma lei fisica representada por uma 
equação do tipo (6.5.1) está expressa numa forma manifestamente covariante, bastando 
olhar para a equação para se inferir sua validade em todos os sistemas de referência 


inerciais. 


Dado um conjunto de leis físicas sabidamente válidas em todos os sistemas inerciais, 
é importante exprimi-las numa forma manifestamente covariante.!! Isso, entre outras 
vantagens, facilita a determinação de como se transformam as grandezas físicas relevantes 
quando se passa de um referencial inercial para outro. Um exemplo de suma importância 


é fornecido pela eletrodinâmica clássica. 


Em unidades CGS gaussianas as equações de Maxwell no vácuo escrevem-se 


V.E=47p, V-B=0, VxE+-—=0 , VxB--—=~—j. (65.3) 
C C 


Estas equações prevêem que a luz se propaga no vácuo com velocidade constante c. Se- 
gundo o postulado fundamental da teoria especial da relatividade, isto é verdadeiro em 
todos os sistemas de referência inerciais, o que é compatível com as transformações de 
Lorentz mas contradiz as transformações de Galileu. Portanto, as Eqs.(6.5.3) devem ser 
válidas em todos os referenciais inerciais, devendo ser possível reescrevê-las em forma 


manifestamente covariante sem alterar seu conteúdo. 


Comecemos pela lei da conservação local da carga elétrica 


Op 
Vues 0.4 


que se deduz facilmente das Eqs.(6.5.3). Vamos introduzir o candidato a quadrivetor 
Je = (ep, jos dy de) = (ep, 3) ; (6.5.5) 


que permite reescrever (6.5.4) na forma 


0, J" =0. (6.5.6) 


"Quando se refere a uma equação ou lei física, a palavra “covariante” significa “válida em todos os 
referenciais inerciais” . 
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Como a experiência indica a validade da lei da conservação da carga elétrica em todos os 
sistemas inerciais, conclui-se que J“ é um quadrivetor. Pela Definição 6.4.3, a Eq.(6.5.6) 
assevera que um escalar é igual a zero, o que é verdadeiro em todos os referenciais inerciais. 
Assim, (6.5.6) é a forma manifestamente covariante da equação da continuidade (6.5.4). O 
quadrivetor J” definido por (6.5.5) é chamado de quadricorrente ou quadrivetor densidade 


de carga-corrente. 


E Exercício 6.5.1. Prove que as densidades de carga e corrente transformam-se de acordo 
com 


P =YP- do)» jz=V¥Ge-%p) > ty=dy o T= de (6.5.7) 


no caso da transformação de Lorentz pura (6.1.1). E 
É útil introduzir os potenciais @ e A tais que 
B=VxA , E=-V¢--—. (6.5.8) 
Consideremos, entao, 
At = (¢, A) (6.5.9) 


como novo candidato a quadrivetor. A primeira das equações (6.5.8) sugere introduzir um 


tensor de segunda ordem Ft” definido como o rotacional de A”: 


q OP AN 2G" AR (6.5.10) 


E fácil comprovar que as componentes de F”” são 


“CB 0 -B (6.5.11) 
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A título de verificação consideremos, por exemplo, Fº. 


F% = 9° A! — 94º = Az, +Ad= 1 OAs og = 
c Ot Ox 


ae ae 


m Exercício 6.5.2. Verifique que as demais componentes de Ft!” são dadas por (6.5.11). E 


Uma vez que suas componentes exprimem-se em termos das componentes de E e B, 
Fr” é chamado de tensor do campo eletromagnético. E importante destacar que Ft” é 


um tensor anti-simétrico: 


PM =P (6.5.12) 


Em termos do tensor do campo eletromagnético as equações de Maxwell (6.5.3) tomam a 


forma 


4 
6,Fm! = , (6.5.13) 

C 
BPFH 4 OHF”? 4 OVF” =Q | (6.5.14) 


As equações (6.5.13) coincidem com as equações de Maxwell não-homogêneas, ao passo 
que as equações (6.5.14) são idênticas às equações de Maxwell homogêneas. Por exemplo, 
tome v = 0 em (6.5.13): 


47 OF OF OF? OF 4r 
F (O __ 0 | | | = V = 
las as FF Or! ` O22 dx c me REED 


Analogamente, escolhendo a =0,u=1,v=2 em (6.5.14) resulta: 


1B, dE, O(-Es) 


DPF? PPP! =0 = 
c Ot 
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A validade empiricamente corroborada das equações de Maxwell em todos os referen- 
ciais inerciais nos leva a concluir que A” é um quadrivetor e Ft!” um tensor de segunda 
ordem. Assim, (6.5.13) e (6.5.14) constituem a expressão das equações de Maxwell em 


forma manifestamente covariante. 


Hm Exercício 6.5.3. Usando a lei de transformação (6.4.2) de um tensor contravariante, 
mostre que, no caso da transformação de Lorentz pura (6.1.12), o campo eletromagnético se 
transforma conforme 


Et = Ez ; B! = B, , 
E, = 9 (Ey — 6B) , B, = y (By + BE) , (6.5.15) 
E, =y (Ez + BB) , B, ma (B, = BEy) . 


Sugestão: denotando por F a matriz (6.5.11), mostre que a lei de transformação de Ft!” pode 


ser escrita na forma matricial F’ = AFAT. E 


6.6 Dinâmica Relativistica 


A mecânica newtoniana é invariante sob transformações de Galileu. Em particular, a 


segunda lei de Newton para uma partícula, 


=F, (6.6.1) 


preserva sua forma admitindo-se a invariância de F, já que a aceleração é invariante sob 
transformações galileanas. Para dar à segunda lei de Newton uma forma invariante sob 
transformações de Lorentz é de se esperar que seja necessário modificar o seu conteúdo, 
ao contrário do que ocorreu com a teoria eletromagnética, cuja covariância relativística já 


estava embutida nas equações tal como originalmente propostas por Maxwell. 


A fim de obter a versão quadridimensional da Eq. (6.6.1) comecemos procurando definir 
a quadrivelocidade. A idéia mais imediata seria considerar dx”“/dt, mas este objeto não 
é um quadrivetor porque dt não é um escalar. Devemos, portanto, substituir dt por um 


intervalo de tempo que seja um escalar. O intervalo de tempo próprio dr é definido 
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como o intervalo de tempo medido no sistema de referência em que a partícula encontra- 
se instantaneamente em repouso. Suponha que, no instante t de um referencial K, a 
partícula tenha velocidade v quando vista de K. Seja K’ um referencial inercial que 
move-se com velocidade v relativamente a K, de modo que, do ponto de vista de X’, 
a partícula encontra-se em repouso no instante t de K. Seja ds o intervalo invariante 
entre os eventos definidos pela passagem da partícula pelos pontos (x,y,z) no instante t 


e (x + dz,y + dy, z+ dz) no instante t + dt. Evidentemente, dr = vdt, de sorte que, no 


referencial K, 


ds = dt? — dr - dr = dt? (1—v?/c’) . (6.6.2) 


Mas, do ponto de vista de K’, 


ds” = ê dr? (6.6.3) 


porque no intervalo de tempo dr medido em K’ a partícula permaneceu imóvel, visto que 
E 5 , 2 
o referencial K’ acompanhou o movimento da partícula. Mas ds? = ds” por causa da 


invariância do intervalo, donde se conclui que 


dr = y1 —v?/c? dt = dt/y , (6.6.4) 


com y definido por (6.1.4). Note que a Eq.(6.6.3) comprova que dr é um escalar, pois ds” 


e a velocidade da luz no vácuo são escalares. 


A quadrivelocidade U” é o quadrivetor definido por 


dx” 
UNS 6.6.5 
dr 9 ( ) 
cujas componentes sao 
U! = (yc, yv) , (6.6.6) 


onde v = dr/dt é a velocidade tridimensional da partícula. Uma conseqüência imediata 
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desta definição é que o quadrado de UF é sempre uma mesma constante independente- 


mente do estado de movimento da partícula: 


UEU See (6.6.7) 


Isto mostra que a quadrivelocidade U” é um vetor do tipo tempo que nunca se anula. 


Analogamente, a quadriaceleração é o quadrivetor definido por 


au. » det 
A! = aa E (6.6.8) 
cujas componentes sao 
v-a v-a 
A= EE, ty pa) (6.6.9) 


onde a = dv/dt é a aceleração tridimensional. No referencial de repouso momentâneo da 
partícula, v = 0 e as componentes da quadriaceleração reduzem-se a A” = (0,a), donde 
se deduz que a quadriaceleração é um vetor do tipo espaço e só se anula se a aceleração 


própria — isto é, a aceleração medida no referencial de repouso instantâneo — for zero. 


m Exercício 6.6.1. Prove diretamente, ou utilizando (6.6.7), que 
ALU gas (6.6.10) 
isto é, a quadrivelocidade e a quadriaceleração são vetores ortogonais. E 


Finalmente, o quadrimomento de uma partícula define-se por 


P” = moU” = (ymoc, ymov) , (6.6.11) 


onde mo é um escalar chamado de massa de repouso ou, simplesmente, massa da partícula. 


De (6.6.7) decorre imediatamente 


P!P, = me a (6.6.12) 
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Podemos escrever 


P! = (ymoc, p) , (6.6.13) 
onde 


Mo V 
p = ymv = ——— 
1 — v2/c2 


é o momento linear relativístico. O momento linear relativístico reduz-se à expressão 


(6.6.14) 


newtoniana mov no limite v < c e uma experiência imaginária, concebida por G. N. 
Lewis e R. C. Tolman, prova que é exatamente a forma (6.6.14) que garante a validade 
da lei da conservação do momento linear em todos os referenciais inerciais (Pauli 1958; 
Bergmann 1976). 


Estamos prontos, agora, para propor a versão covariante da segunda lei de Newton na 


forma 


H 
A = pu, (6.6.15) 
a 


onde F!” é a quadriforça, também chamada de fj, ça de Minkowski. Por razões de con- 


sistência, o quadrivetor força F” tem que ser ortogonal a Pr: 


FºP,=0. (6.6.16) 


E Exercício 6.6.2. Demonstre (6.6.16). E 


A Eq.(6.6.15) é desprovida de conteúdo a menos que se saiba como relacionar F! 
com a força tridimensional F. O procedimento mais simples possível consiste em fazer a 
hipótese de que permanece válida a conexão newtoniana entre a força e a taxa de variação 


temporal do momento linear: 
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dp A mo V ) 


= =F. 6.6.17 
dt dt y1 — y2/e2 ( ) 


Comparando esta equação com as componentes espaciais de (6.6.15) e utilizando (6.6.4) 


encontra-se F” = (Fº ~F). A componente temporal Fº obtém-se facilmente de (6.6.16): 


ymocF? -PMF -v=0 = P= TF v. (6.6.18) 


Assim, a força de Minkowski F” é dada por 


F =(IF-v, F), (6.6.19) 
C 


o que demonstra que F” tem apenas três componentes independentes. 


A consistência de (6.6.19) pode ser testada no caso eletromagnético. A força de Lorentz 


F =e(E+ - x B) (6.6.20) 


depende linearmente do campo eletromagnético e da velocidade da partícula. Assim, a 
força de Minkowski F” deve ser um quadrivetor construído exclusivamente com Ft” e 


U!” , devendo ser linear nestas quantidades. A única forma possível para F” é 


F" =k FU, sy  o& = esealar: , (6.6.21) 


e a equação de movimento covariante (6.6.15) toma a forma 


mA" = k FU, . (6.6.22) 


No referencial de repouso instantâneo K’ a velocidade da partícula é zero, não há correções 
relativísticas e a equação de movimento newtoniana (6.6.1) é exata. Mas em K” temos 
A! = (0,a), U, = (c,0,0,0), o que reduz a componente temporal de (6.6.22) à identidade 
0 = 0, ao passo que parte espacial, obtida fazendo sucessivamente u = 1,2,3, coincide 


com 
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moa = KCE’ , (6.6.23) 


tendo sido utilizada a Eq.(6.5.11). Como a força de Lorentz no referencial de repouso 
instantâneo é F = eE’, o escalar « fica determinado: « = e/c. Portanto, a equação de 


movimento covariante de uma partícula carregada num campo eletromagnético externo é 


dP" 
= ue UA (6.6.24) 


E Exercício 6.6.3. Mostre que as componentes da força de Minkowski eletromagnética 
Fe = pu, (6.6.25) 
c 
coincidem com (6.6.19), onde F é a força de Lorentz (6.6.20). E 


Por construção, a parte espacial da equação de movimento covariante (6.6.15) coincide 
com a Eq.(6.6.17), que é o que se chama comumente de equação de movimento relativística 
da partícula. A pergunta que naturalmente se coloca é: qual é o significado físico da 
componente temporal da equação de movimento covariante? Com a ajuda de (6.6.4) e 


(6.6.19) podemos escrever 


2 a 
aye ey ee 6.2 
T Yg) F Fv, (6.6.26) 
ou seja, 
= ( id )=Fev (6.6.27) 
dA ve | o 


Tendo em conta que F-v é a potência fornecida à partícula pela força F , devemos tomar 


(6.6.28) 
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como definição de energia relativística da partícula: a componente temporal da equação 


de movimento covariante representa a lei da conservação da energia. 


Em face da definição (6.6.28) podemos escrever 


(6.6.29) 


Desta forma, energia e momento linear passam a constituir um quadrivetor, fazendo com 
que as leis da conservação da energia e do momento linear deixem de ser independentes, 


tornando-se aspectos de uma lei de conservação covariante do quadrimomento. 


No limite não-relativístico a expansão binomial fornece 


1 
E = me 4 mou” ee ee (6.6.30) 


O segundo termo é a energia cinética newtoniana, e os termos seguintes são correções 
relativísticas à expressão clássica. O primeiro termo não tem análogo clássico e implica 


que uma partícula em repouso contém energia dada pela célebre equação de Einstein 


E=mc , (6.6.31) 


que estabelece a equivalência entre massa e energia: uma massa mp em repouso pode ser 


convertida numa quantidade equivalente de energia moc’. 
E Exemplo 6.6.1. Movimento unidimensional de uma partícula relativística sujeita a uma 
força constante, também conhecido como “movimento hiperbólico”. 


Solução. Este exemplo pode corresponder à aceleração de uma partícula carregada por um 
campo elétrico constante e uniforme. No caso unidimensional a Eq.(6.6.17) assume a forma 


d mo x 
=F. .6.32 
=( Cia) Coe 


Uma integração imediata fornece 


i F 
E dido 4 we, (6.6.33) 


V1 — &2/c? E mo 
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Figura 6.6.1: Linha de universo de uma partícula relativística sob a ação de uma força 
constante. 


onde b é uma constante de integração arbitrária. Resolvendo esta equação para t somos con- 
duzidos a 


at + b 


“E CNT (io 


que mostra que, diferentemente do problema não-relativístico, a aceleração da partícula não é 
constante. !2 Após uma nova integração elementar encontramos 


(6.6.35) 


x = 14 a 


C 


Consideremos o caso particularmente simples em que a partícula começa em repouso na origem, 
isto é, x(0) =0 e (0) = 0. Em tais circunstâncias b = 0 e xo = —c?/a, donde 


o= S| ERE Gi (6.6.36) 


cê 2 22 C 
(x + —) OP =, (6.6.37) 
que é a equação de uma hipérbole no plano zz? (vide Fig. 6.6.1). E 


12A aceleração própria da partícula é constante. 
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E Exercício 6.6.4. Inspecionando a Eq.(6.6.33), prove que « < c para qualquer t e que 
t — c no limite assintótico t > oo. Encontre o limite não-relativístico da Eq.(6.6.36) passando 


formalmente ao limite c — oo e mostre que os resultados esperados são obtidos. E 


Um importante resultado é o que relaciona a energia da partícula com o seu momento 


linear, a saber: 


Uma outra característica da mecânica relativística não partilhada pela mecânica new- 
toniana é a possibilidade de existência de partículas de massa de repouso zero (fótons, 


gravitons). Fazendo mo = 0 em (6.6.38) resulta 


E=|pjc, (6.6.39) 


que é a conexão relativística entre E e p para partículas de massa zero. Uma faceta 
fundamental das partículas de massa nula é que, em módulo, sua velocidade é sempre c 


em qualquer referencial inercial, como o leitor é instado a demonstrar. 


E Exercício 6.6.5. A partir das Eqs.(6.6.12) e (6.6.29) deduza (6.6.38). Prove, ainda, que a 
velocidade da partícula pode ser expressa na forma 


2 
c 
v= = (6.6.40) 
e daí conclua que |v| = c se a partícula tiver massa zero. E 


6.7 Colisoes Relativísticas 


As leis de conservação da energia e do momento linear numa colisão de partículas 


podem ser sintetizadas na equação covariante 


(1) (D) _ plF) (F) 
Pay +: Pim = Pay ++ Pim) : (6.7.1) 
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O estado inicial (antes da colisão) contém N partículas e o estado final (depois da co- 
lisão) contém M partículas, e P e Be denotam os quadrimomentos inicial e final, 
respectivamente, da k-ésima partícula. Sendo uma equação tensorial, (6.7.1) assegura a 
validade da conservação da energia e do momento linear em todos os sistemas de referência 
inerciais. Iustraremos, a seguir, a notável eficiência da Eq.(6.7.1), aliada à invariância do 
produto escalar (6.3.4), para extrair de forma elegante e concisa informações importantes 


a respeito de processos envolvendo colisões de partículas com altas energias. 


E Exemplo 6.7.1. Antiprótons podem ser produzidos numa colisão próton-próton segundo a 
reação 


p+p>p+p+p+P, (6.7.2) 


onde p denota um próton e p um antipróton. Se o próton-alvo encontra-se em repouso no sistema 
de referência do laboratório, qual é a energia mínima (limiar) do próton incidente para que a 
reação seja possível? 


Solução. De acordo com (6.6.27), uma partícula livre tem a menor energia possível quando 
está em repouso. Portanto, a energia mínima do próton incidente é aquela que permite a formação 
dos produtos da reação em repouso. No entanto, os produtos da reação não podem ser formados 
em repouso no referencial do laboratório, pois isso violaria a lei da conservação do momento linear. 
Em conseqiiéncia, os produtos da reação só podem ser formados em repouso no referencial do 
centro de massa, pois é nesse referencial que o momento linear total é zero. Denotando por PŒ) 
o quadrimomento total dos produtos da colisão, suas componentes no referencial do centro de 
massa são 


PO) = (4mc,0,0,0) (no referencial do centro de massa) , (6.7.3) 


porque cada um dos produtos da reação tem quadrimomento com componentes (mc,0,0,0), 
onde m é a massa de repouso do próton (igual à do antipróton). A lei de conservação do 
quadrimomento escreve-se 


P+Q=P) , (6.7.4) 


onde P e Q são, respectivamente, o quadrimomento do próton incidente e o quadrimomento 
do próton-alvo. Quadrando a Eq.(6.7.4) resulta 


P2+9P.Q+P-=PO) => m242P-Qim2=P” , (6.7.5) 


onde usamos (6.6.12). As demais quantidades escalares envolvidas nesta última equação podem 
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ser calculados no referencial inercial que se revelar mais conveniente. Assim, calculando o lado 
direito de (6.7.5) no referencial do centro de massa com a ajuda de (6.7.3), resulta 


PY)? — 16m? 2 , (6.7.6) 


onde usamos (6.3.4b). Finalmente, no referencial do laboratório temos 


E 
Pa (=, p) , Q= (mc,0,0,0) (no referencial do laboratório ) , (6.7.7) 


donde, por (6.3.4a), 


P-Q= ul =mE. (6.7.8) 
c 


Levando (6.7.6) e (6.7.8) em (6.7.5) obtém-se imediatamente 


E=7mc , (6.7.9) 


para a energia limiar da reação (6.7.2). Para possuir esta energia, o próton incidente deve ter 


uma velocidade igual a 0,99c. E 


No caso especial de um fóton, sua energia é hv e seu momento linear tem magnitude 
hv/c, onde h é a constante de Planck e v é a freqiiéncia. Assim, o quadrimomento de 


um fóton é 
= — (1, ñ) (6.7.10) 
onde ú é o vetor unitário ao longo da direção de propagação. É claro que 

P? =0, (6.7.11) 


e se costuma dizer que P é um vetor nulo. 


E Exemplo 6.7.2. Considerando o espalhamento de raios X por uma folha de grafite como 
provocado pela colisão de um fóton com um elétron, A. H. Compton mostrou em 1923 que 
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Figura 6.7.1: Efeito Compton. 


2h 0 
X =)A+—sin?— . (6.7.12) 
me 2 


Deduza a fórmula de Compton, onde À é o comprimento de onda do raio X incidente, \’ o do 

emergente, m é a massa do elétron e 0 é o ângulo entre os raios X incidente e emergente. 
Solução. Na Fig. 6.7.1 um fóton de freqiiéncia v colide com um elétron em repouso e é 

defletido de um ângulo @ ao mesmo tempo que sua freqiiéncia v é diminuída para v’, ao passo 


que o ângulo de recuo do elétron é 6’. Sejam P e P” os quadrimomentos inicial e final do fóton, 
com Q e Q’ os do elétron. A conservação do quadrimomento requer 


P+Q=P'+Q’. (6.7.13) 


Como não queremos nenhuma informação sobre o recuo do elétron, revela-se conveniente eliminar 
o quadrivetor indesejável Q’, isolando-o em (6.7.13) e quadrando a equação resultante: 


Q?=(P+Q-P). (6.7.14) 


Como Q? = Q” e P? =P” =0, ficamos com 


P.P'=Q.(P-P). (6.7.15) 


Calculando o lado direito desta última equação no referencial do laboratório, no qual Q = 
(me,0,0,0), encontramos Q -P = mhv e Q-P' = mhv’, ao passo que 


h / 
aie peer ee (1 — cos 6) . (6.7.16) 


P.P' 
cc c2 
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Levando estes últimos resultados em (6.7.15) obtemos, finalmente, 


hvv' 
E 


(1—cos 0—)=m(v—v) . (6.7.16) 


É facil comprovar que, em termos do semi-ângulo 6/2 e do comprimento de onda A = c/v, esta 


equação torna-se idêntica à fórmula de Compton (6.7.12). E 
6.8 Dinâmica Relativística na Forma Lagrangiana 
No caso de uma partícula sujeita a uma força F conservativa, isto é, 


F=-VV(t) (6.8.1) 


a equação de movimento relativística 


d mov 
ali aja 


pode ser posta na forma lagrangiana. Para tanto basta notar que 


) =-VV(r) (6.8.2) 


Mo X = o 
y1- (2+4 +2)/2 t 


[-mey1- (22 + + 2)/2] , (6.8.3) 


o que nos leva a concluir que a lagrangiana 


L=-moc/1-— v?/c2 — V(r) (6.8.4) 


permite escrever as componentes de (6.8.2) na forma 


i) OL 


= = = 1,2 8. 


com q = 2,qg2 = y,q3 = z. Note que a lagrangiana (6.8.4) não é da forma T — V. 
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Contudo, se V nao depende explicitamente do tempo, uma constante de movimento de 


importancia fundamental é a integral de Jacobi 


OL OL OL Moc? 
i "DE Dy EE oe” (6:8) 


que coincide com a energia total da partícula. 


A lagrangiana (6.8.4) difere de sua contraparte não-relativística apenas no termo 
cinético, o que nos induz a escrever a seguinte lagrangiana relativística para uma partícula 


num campo eletromagnético externo: 


D= -mo?y1 = 2/2 — eb + Év. A (6.8.7) 


onde @ e A são os potenciais do campo eletromagnético. Se ¢ e A não dependem 


explicitamente do tempo a integral de Jacobi coincide com a energia total: 


(6.8.8) 


A formulação lagrangiana que acabamos de discutir não é covariante, pois gera apenas 
a equaçãode movimento relativística (6.6.17), que se refere a um sistema inercial particular. 


Uma formulação lagrangiana covariante deve permitir escrever a equação de movimento 


covariante 
a at ii (6.8.9) 
dt A 
na forma 
d ðL OL 
~ = 6.8.10 
a (au) Obi i ( ) 


onde z” e U” são tratadas como coordenadas e velocidades generalizadas, com 7 de- 


sempenhando o papel do tempo. A lagrangiana L deve ser um escalar para que 0L/02,, 
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e OL/OU,, sejam quadrivetores. No caso de um campo eletromagnético externo, uma 


lagrangiana simples que dá conta do recado é 


es > UUs + Ug A® . (6.8.11) 
C 


Notemos primeiro que 


— (U°Ua) = O T = g°? (6#Ug + Uadh) = SKU + OGUº = 2U" , (6.8.12) 
ðU, ðU, 


OL e 
— = MU” + -A” . 6.8.13 
oU, aa E 
Por outro lado, 
d OA" dza 
— A" = ———— = U,0º A" . 6.8.14 
dr dxa dt Vað ( ) 


Assim, as equações de Lagrange (6.8.10) geradas pela lagrangiana (6.8.11) são 


p AS 
je ee pea RS = 
dr c c Otu 


0, (6.8.15) 


que coincidem com (6.6.24). 


Uma possível objeção à lagrangiana (6.8.11) é que ela só gera a equação de movi- 
mento covariante correta se tratarmos as quatro componentes da quadrivelocidade como 
independentes, o que obviamente não é verdadeiro por causa do vínculo (6.6.7). Pode-se 
contra-argumentar, no entanto, que além de produzir a equação de movimento correta, a 
própria equação de movimento gerada pela lagrangiana (6.8.11) contém o vínculo (6.6.7). 
De fato, de (6.8.15) deduz-se U,dU"/dr = (e/fmo)F"”U,U, = 0 porque F*” é anti- 
simétrico (ver Problema 6.6). Portanto, U,U" = constante e a constante pode ser esco- 
lhida igual a c?. Isto justifica o emprego da lagrangiana (6.8.11) tratando as componentes 


da quadrivelocidade como se fossem todas independentes. 
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Figura 6.9.1: Linhas de universo de duas partículas em interação . 


6.9 Ação à Distância na Relatividade Especial 


Na Seção 6.6 vimos como fazer a formulação covariante da dinâmica de uma partícula. 
O passo seguinte seria desenvolver equações de movimento manifestamente covariantes 
para duas ou mais partículas em interação. Uma das características da mecânica newtoni- 
ana é a ação à distância, tal como a expressa pela lei da gravitação universal. A conservação 
do momento linear total é uma consequência direta da terceira lei de Newton. Se a ação 
e a reação ocorrem em pontos distantes, essa lei não pode ser transplantada diretamente 
para a relatividade especial por causa da ambigiiidade da simultaneidade: só é possível 
uma terceira lei de Newton covariante no caso de interação por contato. É evidente que 
a ação à distância nos moldes estritamente newtonianos é incompatível com a teoria es- 
pecial da relatividade, porque envolve a propagação instantânea, isto é, com velocidade 
infinita, da interação entre as partículas. Para contornar essa dificuldade, poder-se-ia con- 
ceber uma ação à distância retardada, de tal modo que qualquer modificação no estado 
de uma partícula somente seria sentida por outra depois de transcorrido um tempo igual 
ao necessário para a luz cruzar a distância entre elas. Nesse caso, a modificação do mo- 
mento linear de uma partícula não se refletiria na mudança imediata do momento linear 
das outras, mas teria que haver um momento linear em trânsito de uma partícula para as 
outras a fim de assegurar a conservação do momento linear total. Isto indica que, numa 
teoria relativística, as interações entre partículas têm que ser mediadas por campos locais 
dotados de propriedades mecânicas, tais como energia e momento linear. Embora isto seja 
intuitivamente claro, uma demonstração formal da impossibilidade de ação à distância na 


teoria especial da relatividade tem um considerável valor instrutivo. 


Considere um sistema de duas partículas com linhas de universo descritas pelos qua- 
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drivetores (71) e Tia (T2), onde Tı e T2 são os respectivos tempos próprios. O quad- 


rimomento total do sistema no instante t de um referencial inercial K é 


P(t) = P(n) + Po (7) , (6.9.1) 


onde os tempos próprios Tı € Tə correspondem ao mesmo instante t nas linhas de uni- 
verso das partículas. Uma teoria relativística razoável de duas partículas em interação via 
ação à distância deve possuir as seguintes propriedades: (a) o quadrimomento total é con- 
servado em todos os referenciais da teoria especial da relatividade; (b) assintoticamente, 
isto é, para 7; — œ ou 7; — —oo as linhas de universo são retas, isto é, as partículas 
são livres. Esta última hipótese tem por principal objetivo possibilitar a descrição de 
um processo de espalhamento, em que inicialmente as partículas estão muito afastadas, 
aproximam-se e interagem durante um curto intervalo de tempo, e depois afastam-se in- 
definidamente seguindo trajetórias retilíneas desviadas de suas direções originais. Esta 
condição assintótica também assegura que o quadrimomento total se transforma como um 
quadrivetor. Ora, direis, mas isso não é óbvio? Parece, mas não é, porque em (6.9.1) os 
eventos correspondentes aos tempos próprios Tı e T2 são simultâneos no referencial K mas 
não são simultâneos em nenhum outro referencial inercial em movimento relativamente a 
K. No entanto, assintoticamente estes quadrimomentos tornam-se constantes e podem 
ser calculados em qualquer instante. Assim, podemos considerá-los calculados simultane- 
amente em qualquer sistema inercial, de modo que o quadrimomento total transforma-se 
como um quadrivetor. Mas, como a lei de transformação entre referenciais inerciais tem 
que ser a mesma em qualquer instante, se o quadrimomento total transforma-se como 
um quadrivetor na região assintótica a mesma lei de transformação aplica-se em qualquer 


instante, isto é: 


Pr = AM, PY (6.9.2) 


Consideremos dois sistemas de referência inerciais K e K’ com origem comum situada 
sobre a linha de universo da primeira partícula, conforme ilustrado na Fig. 6.9.1. Pela 
hipótese de conservação do quadrimomento total, cada lado da Eq.(6.9.2) é constante e 
pode ser calculado em qualquer instante t ou t’ que se desejar. Explorando essa liberdade, 


calculemos P’ no instante t'=0 e P” no instante t = 0 para obter 


Pole + Po = AM, (Ple + Pale) - (6.9.3) 
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Mas, nos pontos P e Q, a transformação de Lorentz do quadrimomento fornece 


Pulp = A", Paylp , Polo m= NM, Polo : (6.9.4) 


Combinando (6.9.3) e (6.9.4) resulta 


Como a matriz A é inversível, segue-se que 
Polo = Polo ; (6.9.6) 


o que significa que o quadrimomento da partícula é o mesmo nos pontos Q e Q’ de sua linha 
de universo. Como Q e Q’ são eventos arbitrários, demonstramos que o quadrimomento 
total será conservado se e somente se o quadrimomento de cada partícula permanecer 


constante, isto é, se não houver interação entre as partículas. 


Este “teorema da ausência de interação” (Van Dam & Wigner 1966; Ohanian 1976) 
estabelece de forma inequívoca que a implementação da lei da conservação da energia e 
do momento linear de um sistema de partículas em interação requer a introdução de uma 
outra entidade portadora de energia e momento linear, a saber, um campo mediador da 
interação. A interação entre duas partículas afastadas deve ser interpretada como uma 
ação por contato de uma partícula sobre o campo, seguida de propagação do campo e, 
finalmente, ação por contato do campo sobre a outra partícula. A quantidade que se 
conserva é a soma dos quadrimomentos das partículas acrescida do quadrimomento do 


campo. 


PROBLEMAS 


6.1. Dois fótons viajam ao longo do eixo x do referencial inercial K mantendo uma 
distância constante L entre eles. Prove que em K” a distância entre esses fótons é dada 
por L(e+v)¥2/(e— v)". 
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6.2. (i) Mostre que a transformação de Lorentz padrão (6.1.1) pode ser escrita na forma 


x’ =xcosh@¢—ctsenhd , ct’ =—xsenh¢+ct coshd , 


onde tanh¢@ = v/c. (As relações cosh = cosid e isenhd = seni permitem converter 
qualquer identidade trigonométrica numa identidade de funções hiperbólicas.) Note que, 
formalmente, isto é uma “rotação” em x e ict de um “ângulo” i¢; como tal, ela preserva 


x + (ict)?. (ii) Deduza a seguinte forma útil da transformação de Lorentz: 


t +r =e? (ttr) , x = etler). 


Se S” é um referencial que se move com velocidade u ao longo da direção x’ de S’, use 
esta forma da transformação de Lorentz para provar que a velocidade de 5” em relação a 
S é (utv)/(1+uv/c?). 


6.3. Se v’ é a velocidade de uma partícula vista do referencial inercial K’ que se move 
em relação ao referencial K com velocidade u, prove que a velocidade da partícula em 


relação a K é 


VA Da veja 
(1 +u-vi/c?) 


VW = 


Note que, em geral, esta expressão não é simétricaem u e v’. A que se reduz esta equação 


quando v’ e u são paralelas? 


6.4. Dois eventos 4 e B têm uma separação do tipo tempo. Considere uma linha de 
universo reta e linhas de universo curvas conectando A e B. Mostre que o tempo próprio 
entre Ae B, 


Ar= f" ar= f° (dotar, 


é máximo quando calculado ao longo da linha de universo reta. Assim, a linha de universo 


de uma partícula livre pode ser caracterizada como a curva no espaço-tempo de máximo 


CAPITULO 6: PROBLEMAS 243 


tempo próprio. Sugestão: use um sistema de referência em que a partícula movendo-se ao 


longo da linha de universo reta permaneça em repouso. 


6.5. Uma transformação de Lorentz infinitesimal é da forma A“, = ô”, + w!,, onde 
os w! são quantidades infinitesimais. Usando (6.1.19) e desprezando infinitésimos de 
ordem superior à primeira, prove que wi = —w,,. Se A é a matriz associada a uma 


transformação de Lorentz infinitesimal, prove que det A = 1. 


6.6. (i) Prove que um tensor A” é simétrico (anti-simétrico) na forma contravariante se 
e somente se ele é simétrico (anti-simétrico) na forma covariante Ay. (ii) Se A” é um 


tensor simétrico e B!” é um tensor anti-simétrico, prove que A” Bw =0. 
, Tm 


6.7. Mostre que um fóton não pode desintegrar-se espontaneamente num par elétron- 


pósitron. 


6.8. (i) Prove que na mecânica relativística também vale a equação dL/dt = N , onde L = 
rx p éo momento angular e N =r x F éo torque (p é o momento linear relativístico). 
(ii) Se Lt” = g“ P” — q” P! é o tensor momento angular e NH” = zF” — q” Fr” é o tensor 
torque, demonstre que dL'”/dr = Nt” e comprove que a parte espacial desta equação 


corresponde ao resultado do item (i). 


6.9. (i) Se A” é um vetor do tipo tempo, prove que existe um referencial inercial no qual 
ele só possui componente temporal. Sugestão: uma rotação dos eixos permite eliminar 
duas das componentes espaciais do vetor; prove que existe uma transformação de Lorentz 
que elimina a componente espacial remanescente. (ii) Prove que se um quadrivetor é 


ortogonal a um quadrivetor do tipo tempo, então ele é do tipo espaço. 


6.10. Mostre que um fóton não pode desintegrar-se espontaneamente num par elétron- 


pósitron. 


6.11. Uma partícula de massa M decai a partir do repouso numa partícula de massa m 


e num fóton. Encontre a energia de cada um dos produtos finais. 


6.12. Prove que uma partícula de massa não-nula não pode desintegrar-se num único 


fóton. Que lei de conservação é necessariamente violada”? 


6.13. No referencial do laboratório um fóton colide com um próton em repouso. Qual 


é a frequência minima do fóton para que os produtos da colisão sejam um néutron e um 
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méson pi? Denote por m a massa do próton ou nêutron, supostas iguais, e por M, a 


massa do píon. 


6.14. Usando a lei de transformação da quadriaceleração A”, mostre que as compo- 
nentes da aceleração tridimensional a” no referencial K’ em que a partícula se encontra 


instantaneamente em repouso são 


é es fe de= 
” ? deere ’ * 1-v2/e2] 


(1 — v/e) 
onde os eixos x e x’ foram escolhidos ao longo da velocidade v da partícula em relação 


ao referencial K. 


6.15. Um píon com energia de 1200 MeV incide sobre um próton em repouso, produzindo 
vários pions segundo a reação mt +p > p+n7T. Qual é o número máximo n de pions que 
podem ser produzidos na reação? A energia de repouso do próton é 938 MeV e a do pion 
140 MeV. 


6.16. Uma partícula de massa de repouso mo, com velocidade v = 4c/5, colide inelas- 
ticamente com uma partícula idêntica em repouso. (i) Qual é a velocidade da partícula 


composta? (11) Qual é a sua massa de repouso? 


6.17. Uma partícula de massa M em repouso decai em duas partículas de massas my 
e m. Mostre que a energia da primeira partícula no referencial de repouso da partícula 
que se desintegrou é E, = (M? + m? — m3)/2M . 


6.18. O “dual” do campo eletromagnético é o tensor anti-simétrico F“” definido por 


~ 1 
Fey = 2 a, , 


onde «#”6* é a generalização quadridimensional do símbolo de Levi-Civita introduzido 
no Apêndice A: e“”PA = +1 conforme (j,v,p,A) seja uma permutação par ou ímpar de 
(0,1,2,3), e e“””A =0 nos demais casos. (a) Mostre que as componentes de F“” podem 
ser obtidas simplesmente trocando E por Be B por —E em FP”. (b) Prove que as 


equações de Maxwell homogêneas podem ser escritas na forma 


ðL F” =0 . 
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(c) Exprima os escalares de Lorentz FF, F ad e É HF em termos de E e 
B. (d) Prove que se E e B são perpendiculares num dado referencial inercial, eles são 


perpendiculares em todos os referenciais inerciais. 


6.19. O tensor de energia-momento do campo eletromagnético é definido por 


1 1 
qu — | pow py w PLP, 


Mostre que: 


1 
T% = ee (E? + B°) = densidade de energia ; 


para k = 1,2,3 


1 
T% = E (E x B), = vetor de Poynting ; 
T 


o traço de T#” é zero, isto é, 


6.20. Considere uma possível modificação da teoria do campo gravitacional visando torná- 
la relativisticamente covariante. (a) A expressão usual da força F = -mV ¢ é substituída 
por F, = md, 4, onde m é a massa da partícula e ọ é o potencial gravitacional. (b) Na 


equação de movimento covariante 


d 
H — Eu 
g U LaF 


a massa da partícula é suposta variável. Deduza a equação 


atm _ (ção 
dr dr 


e, como consequência, m = Mo exp(¢/c?) , com mo constante. Segundo tal teoria, por- 
tanto, a massa de cada partícula dependeria do potencial gravitacional no ponto em que ela 
se encontra. Esta teoria foi proposta por G. Nordstrôm em 1912, tendo sido abandonada 


logo em seguida. 
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6.21. O vínculo U“U, = c? pode ser incorporado à dinâmica lagrangiana da partícula 


livre relativística por meio de um multiplicador de Lagrange, tratado como um grau de 


liberdade adicional do sistema. Considere, para uma partícula livre, a lagrangiana 


À 


Lat, UM, A, À) = z UU- e). 
Mostre que 
d { OL OL dUx : 
eo - us =o E a Abas 
e 


d (OL OL 
= — HIS 2 — 
(5) JA 0 => UST =C 0. 


Destas equações deduza que À = 0, isto é, À = constante. Conclua, finalmente, que as 


equações de movimento acima equivalem ao par 


dU = 


U%U, = ; , 
dt , É 


que são as equações corretas para a partícula livre, incluindo o vínculo satisfeito pela 


quadrivelocidade. 


6.22. Uma partícula relativística movendo-se sob um potencial escalar externo ¢(x) é 


regida pela lagrangiana 


Ea”, UM) = —(moc” — 6(x)) U4U,, . 


(a) Deduza a equação de movimento da partícula. (b) Se d(x) é independente de x° em 


algum referencial inercial, prove que a quantidade 


moc? + (x) 


1 — v2/c2 


E = 


é constante de movimento. 


Capitulo 7 


DINAMICA HAMILTONIANA 


As equações da mecânica analítica têm um significado que excede em muito o da 
mecânica newtoniana. 


Albert Einstein 


Na formulação lagrangiana, o movimento de um sistema mecânico com n graus de 
liberdade é regido por n equações diferenciais ordinárias de segunda ordem no tempo. A 
dinâmica de Hamilton consiste em substituir as n equações de Lagrange por um certo 
conjunto equivalente de 2n equações diferenciais ordinárias de primeira ordem. De modo 
geral, as equações de Hamilton para problemas específicos não são mais fáceis de resolver 
do que as equações de Lagrange. A importância do formalismo hamiltoniano reside em 
fornecer um método poderoso, geral e flexível para a investigação de questões estruturais da 
mecânica, e, sobretudo, em servir de fundamento para a mecânica quântica e a mecânica 
estatística. Neste e nos próximos capítulos discutiremos como efetuar a transição do 
formalismo de Lagrange para o de Hamilton, bem como as inúmeras vantagens formais 


inerentes à descrição hamiltoniana da mecânica clássica. 


7.1 As Equações Canônicas de Hamilton 


As equações de Lagrange para um sistema com n graus de liberdade constituem um 
conjunto de n equações diferenciais ordinárias de segunda ordem no tempo para as coorde- 
nadas generalizadas qi(t),...,@n(t). O movimento do sistema é univocamente determinado 
desde que 2n condições iniciais sejam especificadas, a saber, os valores de todos os q's e 
q’s num instante particular to. O movimento pode ser representado geometricamente por 


uma curva traçada no espaço de configuração, cujas coordenadas são q1,...,Gn- 
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Na formulação introduzida por Hamilton o quadro é diferente: as equações de movi- 
mento são 2n equações diferenciais ordinárias de primeira ordem no tempo para 2n variáveis 
independentes. O movimento pode ser representado por uma curva traçada no espaço de 
fase, cujas coordenadas são as referidas variáveis independentes. Diferentemente do espaço 
de configuração, no qual um ponto define apenas a configuração (posições das partículas) 
do sistema num dado instante, um ponto do espaço de fase determina o estado do sis- 
tema, isto é, sua configuração (posições das partículas) e a taxa de variação temporal desta 


configuração (velocidades das partículas) num dado instante. 


Naturalmente, as equações de Lagrange podem ser trivialmente substituídas por um 
sistema equivalente de primeira ordem, com o número de equações duplicado, meramente 
introduzindo as variáveis s; = qi, i =1,...,n e tratando q,...,Gn,81,...,5n como 2n 


variáveis independentes. As equações de movimento seriam 


d (e OL 


= = ce Derr 7.1.1 
dt ðs; aqi 0 2 a b) ‘n , ( ) 


qi= Ssi  , 
onde L(q, s, t) é a lagrangiana do sistema. Estas equações, no entanto, envolvem q; e s; de 
forma assimétrica e não são particularmente úteis. 


William Rowan Hamilton mostrou em 1835 que a duplicação simétrica do número de 


variáveis independentes é conseguida graças à descrição da dinâmica por intermédio das 2n 


quantidades q1,...,Qn,P1,...,Pn onde p; é o momento canônico conjugado a qi, definido 
por 
OL 
j= À pi ea Mas 7.1.2 
Pe am (7.1.2) 


Suporemos que a matriz hessiana W = (W;;) com elementos 


OL 
mes 7.1.3 
J 04q:04; ( ) 
é nao-singular, isto é, 
det W #0, (7.1.4) 


pois neste caso o teorema da função implícita (Loomis & Sternberg 1968) garante que 
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as Eqs.(7.1.2) podem ser resolvidas para as velocidades generalizadas. Assim, a descrição 
hamiltoniana envolve a substituição das variáveis (q,q) por (q,p) em todas as grandezas 
mecânicas, e a introdução de uma função H (q, p, t) em lugar da lagrangiana L(q, q, t) para 
gerar a dinâmica. Tal mudança de descrição realiza-se mediante uma transformação de 
Legendre,* que consiste na utilização dos p's em lugar dos q's e na introdução da função 


de Hamilton ou simplesmente hamiltoniana H(q, p, t) definida por 
i=1 


No lado direito desta equação supõe-se que as velocidades estejam expressas na forma q; = 


fi(q, p, t) resultante da resolução das n equações (7.1.2) para as n velocidades generalizadas. 


As consequências mais imediatas da introdução da função H podem ser deduzidas 


tomando-se a diferencial da Eq.(7.1.5): 


=r 2 (OL ðL OE 
dH = Y. (ġidpi + piddi) — [S (Geta | ng) ie ay (7.1.6) 


i=1 i=1 t 


Em virtude da definição dos p's e das equações de Lagrange, esta última equação reduz-se 


a 


Do. ; OL 
dH = D (didpi — pidqi) — OL 


i=1 


dt, (atm) 


indicando que, de fato, H só depende dos q's e p's. Por outro lado, 


” ,oH oH OH 
dH = dq; À dp;) 4 dt . 7.1.8 
Nay, eT aaa eae pe 
Comparando estas duas últimas equações resulta 
OH OH 
= o RE a eee S 7.1.9 
a= 3, ù Da, i n (7.1.9) 


e, como subproduto, 


1As transformações de Legendre são largamente utilizadas na termodinâmica e também possuem um 
significado geométrico interessante (Callen 1960; Arnold 1976) que não poderemos discutir aqui. 
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OH OL 
a ae (7.1.10) 


As equações (7.1.9) são conhecidas como equações de Hamilton ou equações canônicas de 
Hamilton, e são um conjunto de 2n equacões diferenciais de primeira ordem equivalente 
ao sistema de n equações de segunda ordem de Lagrange. As quantidades (q,p) são 
chamadas de variáveis canônicas.? Quanto a (7.1.10), não se trata de uma equação de 
movimento, mas de uma importante relação entre as dependências temporais explícitas 
da lagrangiana e da hamiltoniana. A primeira metade das equações de Hamilton exprime 
os q's em termos da variáveis canônicas, ou seja, elas são as inversas das equações (7.1.2) 
que definem os momentos canônicos p;. Ressalte-se, no entanto, que, ao contrário da 
formulação lagrangiana, na qual vale a priori a conexão q; = dq;/dt, na dinâmica de 
Hamilton não há qualquer conexão a priori entre as variáveis canônicas, isto é, os q's 
e p's são inteiramente independentes entre si. Por isso as duas metades das Egs.(7.1.9) 
devem ser encaradas em pé de igualdade, constituindo o conjunto completo de equações 


de movimento do sistema. 


Resumindo, a construção das equações de Hamilton envolve os seguintes estágios: 
(a) Escolhidas coordenadas generalizadas, constrói-se a lagrangiana L(q, q,t). 
(b) As Egs.(7.1.2) são resolvidas para as velocidades q; como funções de (q, p, t). 
(c) Constrói-se H (q, p, t) substituindo-se em (7.1.5) os q's obtidos no passo anterior. 
( 


d) Uma vez obtida H(q, p, t), as equações de movimento do sistema são (7.1.9). 


A lagrangiana usual é L = T—V. Se (i) T é função puramente quadrática dos q's e (ii) 
V é independente das velocidades, então >; q;0L/0q; = >; G@OT/0g; = 2T pelo teorema 


de Euler das funções homogêneas. Em consequência, 


H=T+V=E, (UA) 


isto é, a hamiltoniana é a energia total expressa como função das coordenadas e momentos. 
As condições (i) e (ii) prevalecem na maioria esmagadora dos casos de interesse físico, de 
modo que a hamiltoniana possui o significado físico extremamente importante se ser a 
energia total do sistema na vasta maioria das situações relevantes. Além disso, essas 
condições são apenas suficientes, sendo possível que elas não sejam satisfeitas e, ainda 


assim, H coincida com a energia total (vide Exemplo 7.1.2). 


E Exemplo 7.1.1. Obter as equações de Hamilton para uma partícula num potencial central. 


2A palavra “canônica” é usada no sentido de “padrão”. 
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Solução. Em coordenadas esféricas a lagrangiana escreve-se 


LeTev= T(P? + 126? + r? sin? 0?) — V(r) , (7.1.12) 
donde 
L L L 
Pr = - =m , po= = =mrð , Po = = = mr sin? 0 ġ . (7.1.13) 


Resolvendo estas equações para as velocidades encontramos 


._ Pr ; Po . Pp 
= = = E 7.1.14 
ane ae mre’ © mr2sin?6 ( ) 
de sorte que 
—; ; . o 1l/2, P po 
H = ù pr + 0 po + $ Po L= dm (r? ka ae 5 aa) + V(r) i (7.1.15) 


Esta hamiltoniana é igual à energia total da partícula e as equações de Hamilton são 


0H p : OH Pe . OH Pe 


i — — ee 0 a 7? — — , Ta 1 . 1 6 
s Opp mo po mr? ° P Op, mr?sin? ð ( 2 
ðH p Do dV 0H  poeoto ., OH 
„= = , Do = = , Pe =—-— =0 , (7.1.16b 
P ðr mr? ni mr3sin?0 dr Pe 30  mr?sin?ð Pe Op ( ) 


Conforme uma observação geral já feita, as Eqs.(7.1.16a) são as inversas de (7.1.13), e com o 
seu uso as Eqs.(7.1.16b) tornam-se idênticas às equações de Lagrange oriundas da lagrangiana 


(7.1.12). E 


E Exemplo 7.1.2. Construir a hamiltoniana e as equações de Hamilton para uma partícula 
num campo eletromagnético externo. 


Solução. Em coordenadas cartesianas temos 


L= T (8? +9 +2) go) + Êv A(t) , (7.1.17) 
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donde 
OL q OL q OL q 
E va OR Ke. E = his 7.1.18 
Pes ae + ade pp GR aa + ( ) 
Assim, 
1 q 
v=—(p-ŻA) (7.1.19) 
m c 
e, conseqüentemente, 
i: a A 14) +90 (7.1.20) 
p 5m \P- 2 . 1. 


Esta hamiltoniana é a energia total se e A não dependem explicitamente do tempo (campos 
E e B estáticos). As equações de Hamilton tomam a forma 


. H 1 q 
m = —_(p A) , (7.1.21a) 
pan = (p 1A):VA+(p-%A)x(V xA) — qvo (7.1.21b) 
ðr me c c i 
onde usamos V (G - G) = 2(G- V)G + 2G x (V xG). E 


E Exercício 7.1.1. Substituindo a primeira das equações de Hamilton (7.1.21) na segunda, 
mostre que elas são equivalentes a 


mi = q(E + xB), (7.1.22) 


que é a equação de movimento newtoniana. E 


7.2 Coordenadas Cíclicas e Leis de Conservação 


Conforme definimos na Seção 2.5, uma coordenada q; é dita cíclica ou ignorável se ela 


não aparece na lagrangiana. Em decorrência da definição dos momentos canônicos e da 
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hamiltoniana, q; também não aparece em H. Portanto, segue-se das equações de Hamilton 


que 


bj =-— =0 (7.2.1) 


e o momento conjugado a q; é constante de movimento. De forma ligeiramente modificada, 
a conexão entre simetrias e leis de conservação, já estudada no formalismo lagrangiano, 


pode ser reformulada na linguagem hamiltoniana. 


EH Exercício 7.2.1. Considere um sistema de partículas descrito, em coordenadas cartesianas, 
pela hamiltoniana H(r4,...,rn,P1,...,Ppn). (i) Se H é invariante sob a translação infinitesimal 
dr; = en, k = 1,... N , prove que a componente do momento linear canônico total P = >>; Pk 
ao longo da direção n é constante de movimento. (ii) Se H é invariante sob a rotação infinitesimal 
or, = 00h x rk, dpk = ÔO x Pk, prove que a componente do momento angular canônico total 


L = 5, try X pk ao longo do eixo de rotação é constante de movimento. E 


Na mecânica lagrangiana sabe-se que se OL/ôt = 0 então a função-energia h é uma 
constante de movimento. Por outro lado, a definição (7.1.5) mostra que, embora dependam 
de variáveis diferentes, H e h têm o mesmo valor. Assim sendo, deve haver um teorema 


de conservação correspondente para H. Com efeito, pelas equações de Hamilton, 


dH OH. OM VSO 


DD E E a) ge 


i 


(723) 


OH OH OH OH\ ôH _ OH 
Oq Op, Op; Oqi ðt ot ` 


Desta equação infere-se um resultado simples e importante. 


Teorema 7.2.1. Se a hamiltoniana não depende explicitamente do tempo, isto é, 


OH/Ot = 0, então H é constante de movimento. 


Vale destacar que, conforme (7.1.10), H depende explicitamente do tempo se e so- 
mente se o mesmo acontece com L. Por outro lado, como já vimos, em quase todas 
as situações de interesse físico H não depende explicitamente do tempo e coincide com 
a energia total do sistema. Assim, o Teorema 7.2.1 efetivamente constitui a lei da con- 
servação da energia na vasta maioria das circunstâncias. Em casos excepcionais, todavia, 
pode acontecer de H se conservar sem ser a energia total ou, inversamente, de H ser a 


energia total sem conservar-se. 
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E Exemplo 7.2.1. Reconsiderando o Exemplo 1.6.2, obtenha a hamiltoniana e estude sua 
conservação assim como a da energia. 


Solução. Como vimos no Exemplo 1.6.2, lagrangiana do sistema é 


L=T= alt? + wr?) , (7.2.3) 


que coincide com a energia cinética da conta. Neste caso, pr = mt e 


2 2 
Pr MW” 9 

A = — —- — 7.2.4 
E oe (7.2.4) 


que não é a energia total (puramente cinética) da conta. Entretanto, H é constante de movi- 
mento porque 0H/ôt = 0. Por outro lado, a energia total 


r (7.2.5) 


não se conserva porque a força de vínculo realiza trabalho por ocasião de um deslocamento real 


da partícula. E 


Também pode acontecer o oposto, isto é, H coincidir com a energia total mas não se 


conservar devido a uma dependência temporal explícita (Goldstein 1980). 


Há uma importante distinção de comportamento entre a lagrangiana e a hamiltoniana 
no que tange à escolha de coordenadas. Diferentes escolhas de coordenadas generalizadas 
alteram a forma funcional de uma lagrangiana, mas o seu valor permanece o mesmo. 
No que se refere à hamiltoniana, todavia, tanto a forma funcional quanto o valor de H 
dependem do conjunto de coordenadas generalizadas adotado. Assim, pode muito bem 
acontecer de a quantidade representada por H ser conservada num sistema de coordenadas 
e, num outro, variar com o tempo. Esta mutabilidade de H , que à primeira vista pode 
parecer inconveniente, é altamente vantajosa e constitui a base do formalismo de Hamilton- 
Jacobi, um poderoso método alternativo de integração das equações de movimento que 


será estudado num dos próximos capítulos. 


7.3 Teorema do Virial 


Seja f uma função real de uma variável real t. O valor médio de f é definido por 
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(f) = lim [| f(t) dt (7.3.1) 


sempre que este limite existe. Em particular, quando f é uma função periódica e integravel 


num período o limite existe e é dado simplesmente por 


Eae RGN ai 


To J0 
onde, na expressão acima, 7) denota o período de f. 


Considere, agora, um sistema mecânico com n graus de liberdade descrito pelas 


variáveis canônicas (q,p) e pela hamiltoniana H(q,p,t). A quantidade 


OH 
ão yy ee 3.2 
y 24 a, (7.3.2) 


é uma generalização do virial, introduzido na teoria cinética dos gases por Clausius. Em 
certas circunstâncias o valor médio de V pode ser relacionado ao valor médio de outras 


grandezas dinâmicas do sistema. 


Teorema do Virial. Se q;(t) e pi(t) são funções limitadas? do tempo e se os valores 


médios de X; q;0H/0q; e >;p:;9H/0p; existem separadamente, então eles são iguais: 


9H 9H 
= qi da? = (Xn: n . (7.3.3) 
Demonstração. Defina a função 


G(t) = Dito) qi(t) . (7.3.4) 


Como q; e p; são funções limitadas do tempo, G também o é. Diferenciando a Eq.(7.3.4) 


em relação ao tempo obtemos 


dG ere OH . OH 
eT PG + LPG DPB DP ae. , (7.3.5) 


“Uma função f é dita limitada se existe um número real positivo M tal que |f(t)| < M para qualquer 
t pertencente ao domínio de f. 
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onde usamos as equações de Hamilton. Tomando o valor médio em ambos os lados desta 


equação resulta 


dG OH _ OH 
nas Dr Dp, ES (7.3.6) 
Entretanto 
dG) tim [Cao lim Ch EO _ 
an = lim f dE oe E =) (7.3.7) 


porque o numerador é limitado mas o denominador cresce indefinidamente. Com as demais 


hipóteses do enunciado do teorema? somos conduzidos à Eq.(7.3.3), conforme queríamos 


demonstrar. 


Como primeira aplicação, considere uma partícula executando um movimento espa- 
cialmente limitado sob a ação de uma força central, tal como um planeta movendo-se em 
volta do Sol ou um elétron orbitando um próton no modelo de Rutherford do átomo de 


hidrogênio. A hamiltoniana em coordenadas cartesianas é 


H=T =i .3. 
+V a EN (7.3.7) 
e o teorema do virial implica 
Pia: Ee es ) 
(p oa Sane VV(r)) = (r fe 3 ! (7.3.8) 
Para o potencial 
A 


a Eq. (7.3.8) torna-se 


4Vale notar que (f +g) = (f) + (9) só é verdade quando os valores médios de f e g existem 
separadamente. Examine o seguinte exemplo: f(t)=1+t e g(t)=1-t. 
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(T) =—={V) . (7.3.10) 


No caso de um potencial gravitacional ou eletrostático (n = 1) o teorema do virial esta- 


belece que 


PTS = (7.3.11) 


ou seja, o valor médio da energia potencial é menos o dobro do valor médio da energia 


cinética. Em geral, a energia total é dada por 


Paty = coe (7.3.12) 


o que mostra que para n > 2 os possíveis estados ligados do potencial V(r) têm energia 
total positiva. O teorema do virial tem outras aplicações interessantes, como, por exem- 
plo, a obtenção de soluções aproximadas para as frequências de osciladores anarmônicos 
(Sivardiére 1986). 


Aliado ao teorema da equipartição da energia, o teorema do virial propicia uma 
dedução surpreendentemente concisa da equação de estado de um gás ideal. Conside- 
remos o gás como constituído por um vasto número de partículas sem interação mútua 
confinadas num recipiente de volume V. As moléculas do gás só experimentam forças 
quando colidem com as paredes do recipiente, e a força média sobre aquelas que atingem 
o elemento de área dS é dF = —PndS, onde P é a pressão do gás e n é o vetor unitário 
normal exterior à superficie S que limita o volume V. O teorema do virial (7.3.3) aplicado 


ao gás toma a forma 


pr Eis = (Er: Fy) = f Pr-nds (7.3.13) 


i 
m 


onde levamos em conta que a forças sobre as moléculas do gás devem-se às colisões com 


as paredes do recipiente. Como P é constante, o teorema da divergência fornece 


2(r)=P | Vrav =P | sav =3PV. (7.3.14) 


Pelo teorema da equipartição da energia, a energia cinética média de cada molécula é 
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3k 0/2, onde k é a constante de Boltzmann e O é a temperatura absoluta. Assim, se o 


número de moléculas do gás é N , a equação (7.3.14) toma a forma 


PV=NkO, (7.3.15) 


que é a equação de estado de um gás ideal. Se levarmos em conta as interações entre 
as moléculas do gás aparece um termo adicional no lado direito da Eq.(7.3.15), o qual 
depende do potencial de interação e de uma função g(r) que mede a probabilidade de se 


encontrar duas partículas separadas por uma distância r (Pathria 1972). 


7.4 Formulação Hamiltoniana Relativística 


Comecemos com o formalismo não-covariante, em que trabalha-se num referencial 
específico e o tempo, encarado como um parâmetro que descreve a evolução do sistema, 
é tratado distintamente das coordenadas espaciais. Para uma partícula num potencial V 


independente das velocidades, 


L=-moc/1-v/2-V(r), (7.4.1) 
donde 


ai (7.4.2) 


p = 
Ov A — v2/2 


Note que o momento canônico p coincide com o momento linear relativístico. Portanto, 


2 2 
Regente O = meiose ey (7.4.3) 


fl — v?/c? fl — v/e 


e H é a energia total, embora a lagrangiana (7.4.1) não tenha a forma de diferença entre 
energia cinética e energia potencial. É preciso, no entanto, exprimir H como função de 
(r, p). Isto é facilmente conseguido recorrendo à relação relativística (6.6.38) entre energia 


e momento linear de uma partícula livre, da qual resulta 
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H = ype + mé +V . (7.4.4) 


No caso de uma partícula num campo eletromagnético externo, 


2/1 Df a2 ve 7.4. 
L Moc v2/c2 —ed(r,t) + - (r,t) , (7.4.5) 
donde 


OL mov e 
poe A. (7.4.6) 


ji-vyja e 


Note que, agora, o momento canônico não é mais idêntico ao momento linear relativístico. 


Temos 


mo C 
1 — v2/c2 


e novamente H é a energia total no caso de campos E e B estáticos. Recorrendo outra 


H=v-p-L= +e, (7.4.7) 


vez a (6.6.38) com o momento linear relativístico substituído por p — (e/c)A , obtemos a 


hamiltoniana em sua forma final: 


H(r,p,t) = |e — -A(r, 0) 2 +mêc! + ed(r,t) . (7.4.8) 


A hamiltoniana relativistica de uma partícula livre é dada por (7.4.4) com V = 0,e 
claramente a transição para a hamiltoniana (7.4.8) de uma partícula num campo eletro- 


magnético externo se faz pela prescrição 


H= Heg 1 pop=2A5 (7.4.9) 
C 


conhecida como acoplamento mínimo. 


Quanto à formulação covariante, tomando como ponto de partida a lagrangiana 
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m e 
LE Ut AMD: (7.4.10) 

2 c 
para uma partícula num campo eletromagnético externo, obtemos os momentos canônicos 


Pt = a = moU! + A (7.4.11) 
m 


O quadrimomento canônico não coincide com o quadrimomento da partícula. A hamilto- 


niana covariante é dada por 


H=P°U,—-L= — (pe = A) (P, - Č Aa) (7.4.12) 


2mo 


A passagem da hamiltoniana de uma partícula livre para a de uma partícula num campo 


eletromagnético externo se realiza pelo acoplamento mínimo 


PE es PPS Ae, (7.4.13) 
c 
que é a versão covariante de (7.4.9). As equações de Hamilton covariantes são 


dx" OH dP” OH 
= Sa ee, À 7.4.14 
dr OR; o. dr OL; l ) 


E Exercício 7.4.1. (a) Prove que a parte espacial das Eqs.(7.4.14) equivale à equação de 
movimento relativistica d(ymov)/dt = e(E + v x B/c). (b) Mostre que a hamiltoniana (7.4.12) 
não é a energia total da partícula mas, apesar disso, é ums constante de movimento e seu valor 


é moc?/2. E 


No que diz respeito às componentes temporais de (7.4.14), temos 


po Ê A? 7.4.15 
CA) (7.4.15) 


donde 
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(7.4.16) 


De acordo com esta equação, a energia total desempenha o papel de momento conjugado 


ao tempo.” Temos, ainda, 


dP OH 10H e e O Au 
Es = = Om Ae 7.4.17 
dr TONA côt me (p c ) Ot ? ( ) 
ou, equivalentemente, 
d e OAy e Od OA 
—(E = — a = — yv: —— 41 
Va! EER Moc mou Ot c he ot IY Ot Gras) 


Cancelando um fator y comum, esta última equação pode ser reescrita na forma 


dE Ob dp ev OA 

a evo Vol ta CDE É (7.4.19) 
ou, finalmente, 

dE 10A 

a =e(- =- a vaeE-v=F-v, (7.4.20) 


onde F = e(E + v x B/c). A Eq. (7.4.20) exprime corretamente a lei da conservação da 
energia, completando a verificação que as equações de Hamilton covariantes (7.4.14) têm 


o mesmo conteúdo que a equação de movimento covariante (6.6.24). 


7.5 Forma Variacional das Equações de Hamilton 


O princípio de Hamilton, formulado em termos de variações da trajetória no espaço 


de configuração, escreve-se 


5Num certo sentido, este resultado não é uma peculiaridade da mecânica relativística, conforme se 
discutirá na Seção 7.6. 


262 CAPiTULO 7. DINAMICA HAMILTONIANA 


t2 
is = öf L(q,4,t) dt =0 , (7.5.1) 


com 6q;(ti) = dqi(t2) = 0. Este princípio variacional pode ser transcrito em termos de 


variações da trajetória no espaço de fase da seguinte forma: 


t2 


6S =o D pidi — H (q, p, t)} dt=0 , (7.5.2) 


a ci= 


onde ógi(ti) = dq;(t2) = 0 e as variações dos q’s e p's são consideradas independentes. 


Com efeito, temos 


9H OH 


to n 
Oo at >(p Git Gopi — Sg Oa Dp, pi) (7.5.3) 
Uma integração por partes fornece 
to t2 t2 t2 
ty is ty ty 
de modo que a Eq.(7.5.3) torna-se 
t2 z OH OH 
: DC TA p (+ 57) a} (7.5.5) 


Uma vez que as variações dos q’s e p’s são arbitrárias e independentes entre si, decorre 
de (7.5.5) que 


—=0 , p+—=0 , t=1,...,n, (7.5.6) 


que são as equações de Hamilton. 


E Exercício 7.5.1. Encarando a ação S como 
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t2 
S= É F(q, p,ġ, ù, t) dt 


1 


com F = >, piġi—H (q, p, t) e aplicando as equações de Euler à função F , reobtenha as equações 
de Hamilton a partir da condição de que S seja mínima (mais geralmente, estacionária) para a 


trajetória física. A 


O princípio variacional (7.5.2) requer apenas que as variações dos q’s anulem-se nas 
extremidades do intervalo de integração, as variações dos p’s permanecendo inteiramente 
arbitrárias. Há diversas vantagens em exigir que também as variações dos p’s anulem-se 
nas extremidades do intervalo de integração. Por exemplo, uma integração por partes em 
(7.5.2) conduz a 


s= [aS qipi — H(q,p,t +d qi pi 
1 El 


p} =o (7.5.7) 


Mas 0(qip;) = 0 em tı e te se os dq’s e ôp’s anularem-se em tı e to, de forma que o 


novo princípio variacional 


af dt|- 5 ap: — H(q,p,t)] = 0 (7.5.8) 


também fornece as equações de Hamilton. Combinando (7.5.2) e (7.5.8) obtemos um 


terceiro princípio variacional 


1 n 
6 f al S (ids — ah) — H(ap,1)} =0 (7.5.8) 


i=l 


que gera as equacoes de Hamilton, com a virtude de oferecer um tratamento mais simétrico 
as coordenadas e momentos. Daqui por diante suporemos que em todos os princípios 
variacionais formulados no espaço de fase as variações das coordenadas e momentos são 
nulas nos extremos temporais, o que revelar-se-á particularmente conveniente no estudo 


das transformações canônicas, a ser empreendido no próximo capítulo. 
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7.6 O Tempo Como Variável Canônica 


Um fenômeno interessante ocorre quando tentamos incluir o tempo no rol das coor- 
denadas generalizadas com o emprego de uma parâmetro auxiliar 6 capaz de descrever 
a evolução do sistema. A única restrição sobre 0 é d@/dt > 0, isto é, t deve ser uma 


função crescente de 0. Façamos, portanto, dni; = t e escrevamos a ação na forma 


Os ext dq; d0 dt 
S= AET O H F> “ID , 6.1 
ee ae aD} ag dO (7.6.1) 
ou, equivalentemente, 
05 n+l 
s=[ dY pid, (7.6.2) 
Bi i=1 
onde 
1 dq; 
Gia a Pe -H . (7.6.3) 


Três aspectos importantes sobressaem das Eqs.(7.6.2) e (7.6.3): (i) o momento conjugado 
ao tempo é —H;; (ii) no espaço de fase estendido (q, p) = (q1, ---,qn+1; P1; ---;Pn+1) a 


hamiltoniana é zero; (iii) a equação pry; = —H é um vínculo no espaço de fase estendido. 


Introduzindo a função super-hamiltoniana® 


H(q, p) = Panyi + H (q1, -< , dn41; Dis Sy Da) (7.6.4) 


definida no espaço de fase estendido, o vínculo exprime-se como 


H(q,p)=0. (7.6.5) 


Por causa deste vínculo, para se formular corretamente as equações de movimento pelo 
método variacional no espaço de fase estendido é preciso fazer uso de um multiplicador de 


Lagrange À e reescrever a ação na forma (vide o último parágrafo da Seção 2.4) 


“Este nome é tomado de empréstimo da cosmologia quântica. 
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bə n+1 05 
Slq,p, À] = 253 pig; — AH (q, p) ) =f do F(q, p, A, g, p, A) . (7.6.6) 


i=1 


As equações de Euler decorrentes de 6S = 0 são 


d /OF\ OF d/OF\ OF l 
(aq) ~ Bu = ° Po > ao » t=1,....n+1, (7.6.7) 
e, também, 
d ;ðF\ OE 
aT Cdr e 0. (7.6.8) 


Levando em conta a forma explícita de F, estas equações reduzem-se a 


OH OH 
= 0 -d! = =1...n+1 .0. 
Da: , a 0 , i RO, : (7.6.9) 


H(q,p) =0. (7.6.10) 


Portanto, o vínculo é automaticamente satisfeito em consegiiência do princípio variacional. 


Considerando a (n + 1)-ésima componente das Egs.(7.6.9) deduzimos 


dt dt 


além disso, 
dpn+1 OH dH dt OH dH OH 
do dE PT Cao SM GER O (EOIR) 


que não é outra coisa senão a Eq.(7.2.2). Por fim, com o resultado (7.6.11) as n primeiras 


componentes de (7.6.9) tornam-se 


du ƏH _ dudt dtoH 0H 
do Op, dt do dO Op; Op? 


(7.6.13) 
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do Oa; dt dð do dq, Ca T 


(7.6.14) 


e recuperamos as equações de Hamilton. 


E Exercício 7.6.1. Podemos interpretar a Eq.(7.6.11) não como determinando À, mas como 
servindo para determinar 6. Em outras palavras, uma escolha de À define que parâmetro @ está 
sendo usado para descrever o desenvolvimento da trajetória no espaço de fase. Por exemplo, a 
escolha A = 1 equivale a tomar 6 = t, e o tempo usual é o parâmetro que está sendo empregado 
para descrever a evolução do sistema. Mostre que, neste caso, as Eqs.(7.6.9) e (7.6.10) coincidem 


exatamente com as equações de Hamilton (7.1.9) acrescidas de (7.2.2). E 


Em suma, pode-se tratar o tempo em igualdade de condições com as coordenadas 
generalizadas desde que se esteja disposto a lidar com um espaço de fase estendido no 
qual há um vínculo, isto é, as variáveis canônicas não são mutuamente independentes. 
Um subproduto formal desse tratamento é que o tempo e a hamiltoniana aparecem como 
variáveis canonicamente conjugadas. Este resultado tem repercussões que transcendem a 
mecânica clássica, pois sugere a existência de uma relação de incerteza entre energia e 


tempo na mecânica quântica, o que de fato se verifica. 


Para que a hamiltoniana de um sistema seja zero, a condição necessária e suficiente é 
que a lagrangiana seja uma função homogênea de primeiro grau das velocidades. Isto é uma 
conseqtiência imediata de (7.1.2), (7.1.5) e do teorema de Euler das funções homogêneas. 
Define-se um sistema com o tempo parametrizado como aquele cujas equações de movi- 
mento independem do parâmetro de evolução escolhido ou, equivalentemente, cuja ação é 
invariante sob transformações arbitrárias do parâmetro de evolução temporal. Um sistema 
com o tempo parametrizado é necessariamente descrito por uma lagrangiana que é função 


homogênea de primeiro grau das velocidades generalizadas. 


EH Exercício 7.6.2. Um sistema com o tempo parametrizado caracteriza-se por uma ação 
invariante sob reparametrizações do tempo, isto é, mudanças arbitrárias do parâmetro de evolução 
temporal. Considere, portanto, um sistema com lagrangiana L(q,q) sem dependência temporal 
explícita e suponha que a ação correspondente seja invariante sob uma mudança infinitesimal 
arbitrária t = t+ eX(t) do parâmetro de evolução. Usando a condição de Noether (2.7.8), prove 


que L é função homogênea de ‘oimeiro grau das velocidades. a 


Em problemas invariantes sob transformações do parâmetro de evolução temporal, 
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o procedimento para se passar do espaço de fase estendido, onde há o vínculo super- 
hamiltoniano H(q,p) = 0, para o espaço de fase reduzido, no qual as variáveis canônicas 
são mutuamente independentes, consiste em percorrer o caminho inverso do que conduziu 
a (7.6.2). Dada uma ação da forma (7.6.6), escolhe-se uma variável canônica para desem- 
penhar o papel do tempo e resolve-se a equação H(q, p) = O para a variável canonicamente 
conjugada correspondente. Esta variável conjugada ao tempo, agora expressa em função 
das demais variáveis canônicas, deve ser introduzida na ação. A coordenada escolhida 
como tempo e o seu momento conjugado não mais aparecem na ação reduzida resultante, 


que tem a forma 


to, n 
1 = 
a qual permite identificar a hamiltoniana não-nula H(q,p,t) no espaço de fase reduzido. 


A guisa de ilustração desse procedimento, consideremos a partícula livre relativística. 


Usando a lagrangiana (6.8.4) com V = 0 podemos escrever a ação na forma 


S= -me f dt \/1 — v2/c2 = -moc f ye dt? — dx? — dy? — dz? (7.6.16) 


ou, em termos de um parâmetro escalar arbitrário 6, 


02 
S = —moe já VeV, do (7.6.17) 
01 
onde 


da 
es =e, 7.6.18 
70 ( ) 


Note que a lagrangiana covariante 


L=-mocyVºVa (7.6.19) 


é homogênea de primeiro grau em Vº. O quadrimomento canônico é 
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OL Vu 
PP So = 7.6.20 
av, “CN 58:20) 
e satisfaz a equação 
PEP. = me , (7.6.21) 


que constituiu um vínculo no espaço de fase estendido (o sinal negativo na definição do 
quadrimomento canônico visa torná-lo idêntico ao quadrimomento usual quando 6 = 7). 


A hamiltoniana é 


Vey, 
H=-P*V,-L= BOVA + moc/V°V, =0 , (7.6.22) 


conforme havíamos antecipado. A ação adequada no espaço de fase estendido escreve-se” 


02 
gs do [—P#V,, — MP? — m22)] , (7.6.23) 
0 


1 


2 


que tem a forma (7.6.6) com H = P? — me. Esta ação dá origem às equações de 


movimento 


da dPº 
Es SODA PS = 
do i 


0, (7.6.24) 


suplementadas por (7.6.21). De (7.6.24) e (7.6.21) se deduz facilmente 


is (7.6.25) 


2moc 


da qual vê-se, por exemplo, que a escolha À = 1/2mp, corresponde a tomar 0 como o 
tempo próprio, pois neste caso V” satisfaz (6.6.7), de modo que V” = U” onde U” é a 


quadrivelocidade. Por outro lado, as Eqs.(7.6.24) equivalem a 


TO sinal negativo no termo P“V, em (7.6.22) e (7.6.23) é para compensar o sinal negativo introduzido 
na definição (7.6.20) do quadrimomento canônico. 
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ou, recorrendo a (7.6.24), 
d | 
— =0, (7.6.27) 
do ga 


que é exatamente a equaçãode movimento gerada pela lagrangiana (7.6.19). Em particular, 
escolhendo-se 0 igual ao tempo próprio esta equação reduz-se a dP"/dr = 0, que é o 


esperado para uma partícula livre. 


A passagem ao espaço de fase reduzido pode ser realizada escolhendo 0 = x°/c=t e 


resolvendo a equação de vínculo (7.6.21) para a variável canonicamente conjugada cP): 


(PP -p =m — cP? =cPy ype + mic! . (7.6.28) 


A solução negativa para Pº deve ser descartada porque a energia E = cPº de uma 


partícula livre é positiva. Levando este resultado na ação (7.6.23) resulta 


S= i at {po +p: *} = [ dt {p -type + mic) : (7.6.29) 


1 


que é da forma (7.6.15) com a hamiltoniana correta 


H = PE + mct , (7.6.30) 


que não é outra coisa senão a energia (6.6.38) de uma partícula livre relativística. 


O procedimento de redução descrito acima é a base do formalismo de Arnowitt-Deser- 
Misner (ADM), desenvolvido com vistas à formulação hamiltoniana da teoria geral da 
relatividade (Arnowitt, Deser & Misner 1962). A teoria da gravitação de Einstein é 
invariante sob transformações gerais de coordenadas e não há nenhuma variável que se 
preste naturalmente ao papel de tempo. Trata-se, portanto, de uma teoria na qual o 


tempo é parametrizado, a hamiltoniana é zero e a ação é da forma (7.6.6). O formalismo 
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ADM tem se revelado importante nas tentativas de construção de um teoria quântica da 


gravitação, e tem encontrado muitas aplicações na cosmologia quântica. 


E Exemplo 7.6.1. (Lemos 1996) Num problema de cosmologia quântica a ação tem a forma 


t2 2 2 
= N | 631 
s= f at{ Ron +40 ($8 - 35 sen) | (7.6.31) 


onde k é uma constante e t designa o parâmetro que descreve a evolução do sistema. Sabendo 
que N e R são quantidades estritamente positivas, obter as equações de movimento no espaço 
de fase estendido (R, Ø, Ppr, pọ) e a hamiltoniana no espaço de fase reduzido resultante da escolha 


t=6. 


Solução. A ação (7.6.31) tem a forma (7.6.6) com N desempenhando o papel de um 
multiplicador de Lagrange. A variável R é interpretada como o raio do universo, e um R 
crescente corresponde a um universo em expansão. Nesse modelo supersimplificado, ¢(t) é um 
campo escalar homogêneo que representa o conteúdo material do universo e é responsável por 
sua expansão. Impondo 6S = 0 com as variações de R, ¢, pr, pg, N arbitrárias e independentes, 
resultam as equações de movimento no espaço de fase estendido 


> Npr : PR 303 : Npg : 
R = => 5 = O Re 6k 5 = ae 5 = 0 , 7.6.32 
pr SR Ore 2Rº Lae RB’ Pé Oo) 
suplementadas pelo vinculo super-hamiltoniano 
2 2 
PR _ Po = 7.6.33 
R ap3 T ÔER f (7.6.33) 


Na relatividade geral o parâmetro de evolução t é arbitrário e, como no caso da partícula livre 
relativística, a fixação do multiplicador de Lagrange N corresponde a uma escolha do tempo, 
isto é, de que quantidade física está sendo empregada para acompanhar a evolução do sistema. 
A escolha t = & exige que resolvamos a Eq.(7.6.33) para pọ, e a hamiltoniana no espaço de 
fase reduzido é H = —py. Como agora ġ = 1, a terceira das Eqs. (7.6.32) mostra que py < 0, 
pois N e R são grandezas positivas. Resolvendo (7.6.33) para pọ e tomando a raiz quadrada 
negativa obtém-se a hamiltoniana reduzida 
R?p3 


A ação reduzida é obtida substituindo ¢ = 1 e a solução (7.6.34) para po em (7.6.31), dando 
como resultado 


t . 2,2 
Sa / “dt {on $ ae dE ake | (7.6.35) 
tı 


O espaço de fase reduzido é gerado pelas variáveis canônicas (R, pp). E 
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Figura 7.7.1: Variação envolvida no princípio de Maupertuis. 


7.7 Principio de Maupertuis 


Historicamente, o primeiro princípio variacional da mecânica foi proposto por Mauper- 
tuis, em 1744, numa forma obscura e marcada pela intenção de dar uma base não apenas 
racional mas também teológica à mecânica (Yourgrau & Mandelstam 1968). Esse princípio 
ganhou forma definitiva e matematicamente rigorosa graças aos esforços de Euler e La- 
grange. Originalmente ele recebeu o nome de “princípio da mínima ação”, mas este título 
é hoje reservado por quase todos os físicos para o princípio de Hamilton. Empregaremos 
a terminologia sugerida por Landau e Lifchitz, e a quantidade envolvida no princípio de 


Maupertuis será designada como “ação reduzida”. 


A variação A que ocorre no princípio de Maupertuis envolve uma variação do tempo, 
ao passo que a variação ô usual é feita a tempo fixo. E necessário, portanto, descrever 


com clareza o significado da variação A. 


Definição 7.7.1. A variação A é definida por 


U=t+At=t+X(), (7.7.1) 
g(t) = a(t) + Agi(t) = ait) + m(t) , (7.7.2) 

ou seja, 
At=t'-t=eX(t) , Aag(th=d(t')—a(t) = ent), (7.7.3) 


onde e é um parâmetro infinitesimal (ver Fig.7.7.1). 
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Principio de Maupertuis. Suponha que: (i) H nao dependa explicitamente do 
tempo; (ii) H seja conservada e tenha o mesmo valor em todas as trajetórias de com- 
paração; (iii) as configurações inicial e final sejam fixas, isto é, Agi(ti) = Ag;(te) = 0. 


Então 


t2 
AI=A [ AS pidi = 0 (7.7.4) 


para uma variação em torno da trajetória física q(t). Em outras palavras, dentre todas 
as trajetórias imagináveis capazes de conectar duas configurações fixas, com hamiltoniana 


constante, o movimento físico verdadeiro é aquele para o qual a ação reduzida 
to 
r= [A pi (7.7.5) 
ti ý 
é mínima ou, mais geralmente, estacionária. 


Demonstração. Para a trajetória real a ação reduzida é dada por 


t2 t2 t2 
rs f dt Spits = | (b+ H)dt = [| Ldt+H (t-t), (7.7.6) 


1 E 1 tı 


pois H permanece constante durante o movimento. Conforme a hipótese (ii), 


t2 
AI=A| Ldt+H (At, —At) , (7.7.7) 


tı 
onde Atı = €X (tı) com definição análoga para At. A variação A é um caso particular 


das transformações infinitesimais (2.7.1) admissíveis no teorema de Noether, sendo lícito 
usar (2.7.6) e (2.7.7) para obter 


A “bare f SE Emn n) -A(S -r)a (7.7.8) 


tı 


Uma integração por partes fornece 
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t2 


“OL mL, 
ty aq: o Og: 


t2 d ðL tt d/OL 
a dtaa) E Ai AETA LA (7.7.9) 


tı 
porque 7;(t1) = mi(to) = O devido à hipótese (iii). Conseqüentemente, 


af Ldt = e dt DE = a (52) [aa — HelX(to) X lti] , (7.7.10) 


1 


onde usamos a definição e a constância de H. Utilizando as equações de Lagrange 
satisfeitas pela trajetória real q(t) e lembrando a definição de At, a Eq.(7.7.10) reduz-se 


a 


t2 
A [| Ldt = -H (At — Atı) , (7.7.11) 


tı 


a qual, uma vez inserida em (7.7.7), conduz imediatamente à Eq. (7.7.4), completando a 


demonstração do princípio de Maupertuis. 


É instrutivo examinar o conteúdo do princípio de Maupertuis em alguns casos particu- 
lares. Quando as equações (1.5.2) que definem as coordenadas generalizadas não dependem 
explicitamente do tempo, a energia cinética é uma função quadrática das velocidades ge- 


neralizadas: 


1 a 
T = 55, Mula) de å - (7.7.12) 
k,l 
Se, além disso, L =T — V com V independente das velocidades, 
l . oT 
>å: Pi = >å on 27 (7.7.13) 


em virtude do teorema de Euler das funções homogêneas. Nessas circunstâncias o princípio 


de Maupertuis afirma que 


t2 
AÍ Tdt=0. (7.7.14) 


tı 
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Por exemplo, considere uma partícula ou corpo rígido na ausência de forças externas. 


A energia cinética é constante e o princípio de Maupertuis toma a forma especial 


Alt- t)=0. (7.7.15) 


Em palavras: de todos os percursos possíveis entre duas configurações fixas, o caminho real 
percorrido pelo sistema é aquele para o qual o tempo de trânsito é mínimo. A semelhança 


com o princípio de Fermat da óptica geométrica é flagrante. 


A forma (7.7.12) da energia cinética sugere que o espaço de configuração seja en- 
carado como um espaço dotado de uma métrica, com a distância dp entre dois pontos 


infinitesimalmente próximos dada por 


do = X` Mula) dada . (7.7.16) 


k,l 


Ma(q) desempenha o papel de um tensor métrico e 


1,do? 
T = ~(— T.17 
Te Can 
ou, equivalentemente, 
FER (7.7.18) 


V2T | 


Usando este último resultado, o princípio de Maupertuis assume a forma 
p2 
A / JIT dp =0 (7.7.19) 
Pl 
ou, finalmente, 


7 E—Vi(q)dp=0. (7.7.20) 
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Esta equacao costuma ser chamada de principio de Jacobi ou forma de Jacobi do principio 
de Maupertuis. No caso de uma só partícula, dp é proporcional à distancia infinitesimal 
em três dimensões em coordenadas curvilineas arbitrárias, e o principio de Jacobi torna- 
se idêntico ao princípio de Fermat da óptica geométrica para a propagação da luz num 
meio não-homogêneo com indice de refração proporcional a VE — V. Outros aspectos 
ainda mais significativos da analogia entre a mecânica clássica e a óptica geométrica serão 


explorados no Capítulo 9. 


Quando T é constante, o principio de Maupertuis na forma de Jacobi afirma que 
o sistema segue a trajetória de menor comprimento no espaço de configuração, isto é, a 
trajetória física é uma geodésica do espaço de configuração. Para uma partícula livre em 
três dimensões o espaço de configuração confunde-se com o espaço físico tridimensional: as 
geodésicas são linhas retas, correspondendo ao fato de a partícula descrever um movimento 


retilíneo uniforme. 


EH Exercício 7.6.1. Uma partícula move-se livremente no espaço tridimensional, exceto pela 
restrição de permanecer sobre uma superfície fixa. Mostre que a partícula segue uma geodésica 


da superfície. E 


PROBLEMAS 


7.1. Uma massa m oscila num plano vertical fixo suspensa por um fio de massa de- 
sprezível que passa por um orifício numa mesa horizontal. O fio é puxado através do 
orifício a uma taxa constante, de tal modo que o comprimento pendente no instante t 
ér=t-at,onde l e a são constantes positivas. Escolhendo o ângulo que o fio faz 
com a vertical como coordenada generalizada, encontre a hamiltoniana do sistema. A 


hamiltoniana é a energia total? A hamiltoniana é constante de movimento? 


7.2. Dada a hamiltoniana H =p?/2/m+a-p+V, com a = a(r) e V = V(r), encontre a 
lagrangiana correspondente. No caso V = —F -r com a e F vetores constantes, obtenha 


a solução das equaçõesde Hamilton com as condições iniciais r(0) = 0 e p(0) = 0. 


7.3. Dada a hamiltoniana H (q1, q», P1, P2) = “Pi — q2P2 — a q? + bq, prove que 
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— bq = 
Rees ; Fa =n@ ; Fz = qe 


qı 


t 


são constantes de movimento. Obtenha uma quarta constante de movimento indepen- 
dente destas três e, usando-as, determine a solução das equações de movimento, isto é, 


qi(t), q2 (t), pi(t), po(t) em termos de quatro constantes arbitrárias. 


7.4. Se a hamiltoniana H e uma quantidade F são constantes de movimento, prove que 


OF/ôt é constante de movimento. Estenda este resultado para 0" F/ôt”. 


7.5. Uma partícula num campo gravitacional uniforme está restrita à superfície de uma 
esfera centrada na origem. O raio da esfera varia com o tempo de uma forma especificada a 
priori: r =r(t) com r(t) uma função conhecida. Obtenha a hamiltoniana e as equações 
canônicas de Hamilton. A hamiltoniana é a energia total? Discuta a conservação da 


energia. 
7.6. (1) Dada a lagrangiana 


202 


Qa Y ot a 
= =y COS wt — 3 QQ sen 2wt — cos 2wt , 
encontre a hamiltoniana correspondente. (ii) Esta hamiltoniana é constante de movi- 
mento? (iii) Obtenha a hamiltoniana em termos da nova variável q = Q coswt e de seu 
momento canônico conjugado. Esta nova hamiltoniana é constante de movimento? Que 


sistema físico ela representa? 


7.7. Considere o problema de N corpos em interação gravitacional do ponto de vista do 
sistema de referência do centro de massa. A hamiltoniana é dada por H = T + V, onde 
T = X; |pil?/2m; e 


1 Gmm; 

V(r... ry) =- MMM 

245 lr: — ry| 

iAj 

(i) Introduza a quantidade I = 555; milr;|? e prove que I=E+T. Sugestão: comprove 
que V é uma função homogênea e aplique o teorema de Euler do Apêndice B. (ii) Levando 
em conta que T é uma quantidade sempre positiva, prove, fazendo duas integrações su- 
cessivas, que I(t) > I(0) + I(OJt + Et?/2. Conclua, finalmente, que se a energia total for 


positiva pelo menos um dos corpos escapará para o infinito no limite t — oo. 
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7.8. Considere um planeta descrevendo uma órbita elíptica em torno do Sol, com as coor- 
denadas escolhidas de modo que o plano do movimento tenha 0 = 7/2. Pela Eq. (7.1.15), 


em coordenadas polares no plano orbital a hamiltoniana escreve-se 


com k > 0. Aparentemente o teorema do virial é válido quaisquer que sejam as variáveis 


canônicas empregadas. Mostre que 


Pi Bp, Pap, + Pe a p 


e, da mesma forma, 


OH, = OH’. OB Ro 
2 og ar ed a O 


Substituindo esses resultados em (7.3.3) deduza 


e, por comparação com (7.3.11), 


2 
Po 

fai SEN) 

aro 


Usando o fato de p, ser constante de movimento, e diferente de zero para órbitas elípticas, 


conclua que 


Argumente que este resultado é impossível. Examinando cuidadosamente a demonstração 
e as condições de validade do teorema do virial, explique as razões pelas quais o seu 


emprego em coordenadas polares conduz a um resultado absurdo (Chagas & Lemos 1981). 
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7.9. O movimento de certas turbulências no hélio líquido é descrito aproximadamente 
pela hamiltoniana H(x,p) = A\/p— Fx, A e F constantes. (i) Encontre a solução geral 


das equações de Hamilton. (ii) Determine a lagrangiana associada a esta hamiltoniana. 


7.10. Construa a hamiltoniana associada à lagrangiana do Problema 1.1. H é a energia 


total? H é constante de movimento? 
7.11. Uma partícula de carga e move-se num potencial central V(r) superposto a um 


campo magnético uniforme B, cujo potencial vetor é A = B x r/2. (a) Mostre que, se 


B for um campo fraco, de modo que efeitos proporcionais a B? possam ser desprezados, 


onde 


e 
= — Fx p 
a 2mc p 


(b) Escreva as equaçõesde Hamilton nesta aproximação. 


7.12. Um sistema físico é descrito pela lagragiana 


onde (p,p,z) são coordenadas cilíndricas e a é uma constante. (a) Determine H. (b) 
Identifique três constantes de movimento. (c) Mostre que a solução da equação radial 


pode ser reduzida a uma quadratura da forma 


t= f a 
ya- (6 = ap?)?/mp? 
sendo a e 5 constantes. 


7.13. Partindo da formulação hamiltoniana, obtenha outra formulação da mecânica usan- 
do como variáveis p,p e uma função Y(p,p,t). Construa a transformação de Legendre 
que leva H(q,p,t) a Y(p,p,t) e deduza as equações de movimento em termos de Y. 


Aplique ao caso particular H = p?/2+w?q?/2 e comente os resultados obtidos. 
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Figura 7.7.2: Problema 7.15. 


7.14. Para uma partícula livre a hamiltoniana é simplesmente H = T , e as equaçõesde 
Hamilton escrevem-se ý; = —OT/0q;. Na formulação lagrangiana, L = T e as equações 


de Lagrange sao 


dt\aq) "dq: 


Como é possível conciliar estas duas expressões distintas para p;? 


7.15. Uma corda inextensível, leve, de comprimento / passa por uma roldana de massa 
desprezível e tem uma massa 2m presa a uma de suas extremidades. Na outra extre- 
midade há uma massa m e, sob ela, suportada por uma mola de constante elástica k e 
comprimento natural zero, uma segunda massa m . Usando q, e q2 como coordenadas 
generalizadas (ver figura), mostre que, a menos de um termo constante sem relevância, a 


lagrangiana é 


m 


+2 E rs k 2 
3 2 + mago + MJQ — =q> - 


L = 2mq + a 


Encontre a hamiltoniana e as equações de Hamilton. Se o sistema é liberado a partir do 


repouso com qı(0) =a e q(0) = 0, determine q(t) e q(t). 


7.16. Na eletrodinâmica de Weber a força entre duas cargas em movimento é gerada pelo 


potencial generalizado 
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onde r é a distância entre as cargas. Considere uma partícula movendo-se num plano sob a 
ação deste potencial. Usando coordenadas polares, encontre a hamiltoniana H(r, 0, pr, pe) 
e as equações de Hamilton. Mostre que pg é constante e reduza o problema radial a uma 


equação diferencial de primeira ordem para r. 


7.17. O movimento de uma partícula num potencial central V(r) é descrito num refe- 
rencial que gira com velocidade angular constante w , em relação a um referencial inercial, 
em torno de um eixo passando pelo centro de força. (a) Mostre que o momento conjugado 
ao vetor posição R (= r, mas visto do referencial girante) é P = m[V +w x R], 
onde V é a velocidade relativa ao referencial girante. (b) Construa a função hamiltoniana 
H(R,P)=P.V-L,onde L = mv?/2-V(r). (c) Mostre que H tem o valor conservado 
E-w-L, onde E é a energia e L é o momento angular (conservado no referencial inercial). 
(c) Note, no entanto, que H £mV2/2+V(R). 


Capitulo 8 


TRANSFORMACOES 
CANONICAS 


You boil it in sawdust: you salt it in glue: 
You condense it with locusts and tape: 
Still keeping one principal object in view — 

To preserve its symmetrical shape. 


Lewis Carroll, The Hunting of the Snark 


As equações de Lagrange são invariantes sob uma transformação geral de coorde- 
nadas, isto é, sua forma permanece a mesma qualquer que seja a escolha das coordenadas 
generalizadas. Na formulação hamiltoniana as coordenadas e momentos são variáveis in- 
dependentes, o que torna possível considerar mudanças de variáveis no espaço de fase 
que preservem a forma das equações de Hamilton, ampliando enormemente a gama de 
transformações admissíveis. Essa ampliação, por seu turno, possibilita escolher judiciosa- 
mente variáveis canônicas que simplifiquem a hamiltoniana e, em decorrência, facilitem a 


resolução das equações de movimento. 


8.1 Transformações Canônicas e Funções Geradoras 


Uma transformação de variáveis no espaço de fase será de nosso interesse apenas se 
preservar a forma canônica das equações de movimento. Mais precisamente, dadas as 


variáveis canônicas (q,p), a hamiltoniana H(q,p,t) e as equações de Hamilton 
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9H OH 
li = , j = e = eres a 8.1.1 
estaremos interessados na transformação inversível 
Q= Qila pt) » P=Pilapt) , t=1,....n, (8.1.2) 


desde que seja possível encontrar uma função K(Q, P,t) tal que as equações de movimento 


para as novas variáveis tenham a forma hamiltoniana: 


Vale destacar que as equações de movimento nas novas variáveis devem ter a forma hamil- 


toniana qualquer que seja a função hamiltoniana original H (q, p,t). 


A validade simultânea das Eqs.(8.1.1) e (8.1.3) implica a validade simultânea dos 
princípios variacionais 


n 


fe Pi Gi — H(g,p;t) dt =0, (8.1.4) 


t n k 
6[ {E PÔ - KQ, P,t)}dt=0 . (8.1.5) 

t ci=1 
Uma condição suficiente para a validade comum de (8.1.4) e (8.1.5) é que os respectivos 
integrandos difiram pela derivada total em relação ao tempo de uma função ®(q,p,t), 


pois 


ô E dt = 6®(q(t2), p(t), t2) — OP (q (tı), p(t), t1) = 0 (8.1.6) 


porque d6q;(ti) = dqi(t2) = 0 e ópilti) = ópilto) = 0. Assim, a transformação (8.1.2) 


preserva a forma hamiltoniana das equações de movimento se 


on E dd 
pb H=5 PQ - K+— o, (8.1.7) 
i=1 i=l 
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ou, em forma diferencial, 


n 


> (pi da; — P;dQi)+(K — H)dt = dð , (8.1.8) 


i=1 


equação que serve para caracterizar uma transformação canônica. 


Definição 8.1.1. A transformação inversível (8.1.2) é dita canônica se a Eq. (8.1.8) 


é satisfeita para alguma função &. 


A forma de (8.1.8) sugere encarar ® como função das caordenadas antigas e novas. 
Suponha que as n primeiras equações (8.1.2) possam ser resolvidas para os n p's em ter- 
mos de (q, Q,t). Neste caso, as n últimas das Egs.(8.1.2) permitem escrever os momentos 
transformados em termos de (q, Q,t). Em outras palavras, podemos tomar (q, Q) como 


um conjunto de 2n variáveis independentes. Definindo a função geradora Fi(g, Q,t) por 


Fla, Q, t) = (q, plq, Q, t), t) , (8.1.9) 
da Eq.(8.1.8) deduz-se 
OF, OF, , 
pe n PER po WE ni 8.1.10 
Oq OQ; : " l ) 
e, também, 
oF 
K(Q,P,t) = H(q pt) + ae . (8.1.11) 


Note que, dada uma função F(q, Q,t), uma transformação canônica fica automatica- 
mente definida pelas Eqs.(8.1.10), com a hamiltoniana transformada fornecida por (8.1.11). 
De fato, invertendo as n primeiras equações (8.1.10) encontramos Q; = Qılq, p, t). 
Introduzindo este resultado no lado direito das n últimas equações (8.1.10) redunda 
P, = P;(q,p,t), e a mudança de variáveis no espaço de fase (q, p) — (Q, P) é canônica 


por construção . 


Pode não ser conveniente ou mesmo não ser possível tomar (q,Q) como variáveis 


independentes, como no caso da transformação identidade Q; = qi, P; = pi. Mas, se 
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pudermos tomar (q, P) como 2n variáveis independentes, existe uma função geradora do 


tipo F2(q, P,t). Com efeito, notando que 


= Pi dQ; = -d(S P; Qi) + 2 QidP, , (8.1.12) 


levando esta identidade em (8.1.8) e definindo 


F= > BOM: (8.1.13a) 
ou, mais precisamente, 
Fila, P,t) = 2 P: Q:(q, Pt) + Og, pla, P,t),t) , (8.1.13b) 
a Eq. (8.1.8) assume a forma 
dF = O dq; + QidP;) + (K — H)dt . (8.1.14) 
Consequentemente, 
p= 5 Q= oe ce is (8.1.15) 
K(Q, P,t) = H(q,p,t) + ne : (8.1.16) 


Como no caso anterior, dada uma função F(q,P,t), pela resolução das n primeiras 
equações (8.1.15) para P; obtém-se P; = P;(q,p,t), e substituindo este resultado no lado 
direito das n últimas Egs.(8.1.15) resulta Q; = Q;(q, p, t), a transformação assim obtida 
sendo automaticamente canônica, com a hamiltoniana transformada K e a original H 


relacionadas por (8.1.16). 


E Exercício 8.1.1. (i) Suponha que se possa tomar (p,Q) como variáveis independentes. 
Definindo F3(p,Q,t) = — >; qipi + P(g,p;t) deduza 
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== , R=- ; PD | 1.1 
“dp; a0,’ | n (8.1.17) 
K(Q, P,t) = H(q,p,t) + o (8.1.18) 


(ii) Definindo F4(p, P,t) = — 5 ;(gipi — QiP;) + ®(q, p, t), mostre que 


OF, OF, 
— = =1 8.1.19 
qi OD; , Qi OP, , , , n , ( ) 
OF: 
K(Q,P,t) = Hap) +a > (8.1.20) 
desde que seja possível considerar (p, P) como variáveis independentes. E 


Naturalmente, são possíveis funções geradoras de tipos híbridos, tais como, para um 
sistema com dois graus de liberdade, G(q, Q1, q2, P2,t) que mistura os dois primeiros 
tipos. Seja como for, funções das variáveis antigas e novas funcionam como “pontes” entre 
as variáveis antigas e novas estabelecendo uma transformação canônica. Uma vez escolhida 
uma função geradora, fica definida uma transformação canônica mas não é possível saber 
a priori se tal transformação será de utilidade para simplificar a hamiltoniana de algum 
sistema físico de interesse. Por outro lado, a mera existência de alguma função geradora 
constitui um critério para determinar se uma mudança de variáveis no espaço de fase é 


canônica. 


E Exemplo 8.1.1. Determinar a transformação canônica gerada por Fo(q, P, t) = Dk qkPk. 


Solução. Pelas Eqs.(8.1.15) temos 


OF: OF: l 
a A Qi = ap = % , @=1,...,0 (8.1.21) 
com K(Q,P,t) = H(q,p,t), que é simplesmente a transformação identidade. E 


A existência de uma função geradora caracteriza a transformação identidade como 
canônica, um resultado esperado. As Egs.(8.1.21) não permitem que se escolha (q, Q) 
como um conjunto de 2n variáveis independentes, de modo que a transformação identidade 


não admite uma função geradora do tipo F,. 
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E Exercício 8.1.1. Mostre que a transformação canônica gerada por Fi(g, Q, t) = re Qk 
é 
pr=Q, , P=-G , t=1,...,n, (8.1.22) 


que, salvo por um sinal, constitui um intercâmbio entre coordenadas e momentos. Esta trans- 


formação admite uma função geradora do tipo F? E 


E Exemplo 8.1.2. Obtenha a transformação canônica gerada por Fı(q, Q, t) = m(q— Q)2/2t 
e aplique-a à resolução do problema da partícula livre unidimensional, cuja hamiltoniana é 
H = p?/2m. 


Solução. Pelas Eqs.(8.1.10) temos 


OF, _ m(q—-Q) OF, _ m(q—-Q) 
ou, em forma direta, 
pt 
= qe a. P=p. (8.1.24) 
m 


Por outro lado, 


K(Q, P,t) = H(q,p,t) 4 = = = (4 (8.1.25) 


e as equacoes de Hamilton transformadas sao trivialmente resolvidas: 


OK . OK 


Q 


onde a e b são constantes arbitrárias. Retornando às variáveis canônicas originais resulta, 
finalmente, 


b 
f=0 ; (8.1.27) 


que é a solução geral da equação de movimento da partícula livre. E 


E Exemplo 8.1.3. Complete a mudança de variáveis no espaço de fase (a e b são constantes) 
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P= ae +a’) (8.1.28) 


de modo a torná-la uma transformação canônica. Aplique-a, em seguida, à resolução do problema 
do oscilador harmônico unidimensional, cuja hamiltoniana é H = p?/2m + mw?q?/2. 


Solução. Precisamos encontrar Q = Q(q,p) de modo que, juntamente com (8.1.28), fique 
definida uma transformação canônica. Escrevendo 


p= (bP — ag)? =b(P— eq) ; CSu (8.1.29) 


e comparando com (8.1.15), concluímos ser adequado buscar uma função geradora do tipo 
Fə(q, P). Devemos ter, portanto 


ðh 


= 2 21/2 — / 
a PE = m=bf P — g dq . (8.1.30) 


Esta integral é elementar, porém é mais conveniente não efetuá-la, pois estamos na verdade 


interessados na outra metade da transformação canônica, dada por 


oF b dq ob ç q p ı/ aq 
Q= aP — e = 5,8en (=) = —sen ( ) ; (8.1.31) 


onde descartamos uma “constante” de integração C(P) a fim de ficar com a transformação 
canônica mais simples possível. Assim, 


b? 1 aq 
= —sen { ss .1.32 
Q = 5 sen (rm) (5.1132) 
e a transformação inversa tem a forma 
b 2aQ 2aQ 
q= Pi 5º) , P= bVPcos( “a ) ; (8.1.33) 


A hamiltoniana do oscilador pode ser escrita na forma 


1 
H(q,p) = (o? + mui?) , (8.1.34) 


o que sugere escolher a = mw em (8.1.28) e, para simplificar as Eqs. (8.1.33), b = v 2a = V2mw. 


Assim procedendo, como F não depende explicitamente do tempo, resulta 


WwW 
K(Q, P) = H(q,p) = eal + mu?) =wP , (8.1.35) 
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de modo que 


>. OK 
. OK E 
P a et, — = — . . 
20 0 = P = constante 7A. (8.1.36b) 


onde E denota a energia total do oscilador (valor constante de H). Retornando à variável 
original q com a ajuda de (8.1.33), obtém-se, finalmente, 


2E 
q= V mga SM wt + 9) ; (8.1.37) 


que é a solução usual da equação de movimento do oscilador. E 


Somente um insensato recorreria a transformações canônicas para resolver os problemas 
da partícula livre ou do oscilador harmônico simples, sistemas cujas equações de movimento 
podem ser trivialmente resolvidas de forma direta. O objetivo dos dois últimos exemplos 
foi ilustrar, em casos elementares, como uma transformação canônica cuidadosamente 
escolhida é capaz de simplificar drasticamente a forma de uma dada hamiltoniana, podendo 
até mesmo reduzi-la a zero. A elaboração de um esquema sistemático de construção de 
uma transformação canônica capaz de anular a hamiltoniana transformada constitui a 


essência do método de Hamilton-Jacobi, a ser discutido no próximo capítulo. 


EH Exercício 8.1.2. Exibindo uma função geradora, mostre que a transformação de ponto 
Qi = filga,...,Qn;t) é canônica e obtenha a expressão dos momentos transformados em termos 


dos momentos originais. E 


8.2 Canonicidade e Parênteses de Lagrange 


A validade de (8.1.8) para t variável implica sua validade para t fixo, isto é 


S [pi dai — Pila, p, t) dQi(a,p,t)]=a0(q,p.) (fixo), (821) 


i=1 
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onde as diferenciais só levam em conta as variações dos q’s e p’s com o tempo mantido 
constante. Reciprocamente, a validade desta equação com t fixo implica a validade de 
(8.1.8) para t variável (Problema 8.1). O teste do caráter canônico de uma transformação 
por meio de funções geradoras não é direto, pois exige a inversão de metade das equações 
(8.1.2) para obter um conjunto de 2n variáveis independentes constituído por n variáveis 
novas e antigas seguida da exibição explícita de uma função geradora. A Eq.(8.2.1) permite 
obter um critério direto e geral de canonicidade em termos dos chamados parêntese de 


Lagrange, que passamos a definir. 


Definição 8.2.1. Seja (7,€) um conjunto de 2n variáveis canônicas dependentes dos 
parâmetros u,v. O parêntese de Lagrange de u e v em relação a (m,€), denotado por 


lu, v](m.6) , é definido por 


“(Ok OF — Onn OE 
[u, vlne) = (5 a as = E) i (8.2.2) 


O próximo resultado estabelece a utilidade dos parênteses de Lagrange para caracteri- 


zar uma transformação como canônica. 


Teorema 8.2.1. A transformação (8.1.2) é canônica se e somente se 


lai’ akopa = apiga = 0 , [t piQ, = (8.2.3) 


Demonstração. Como já vimos, a transformação 8.1.2 é canônica se e somente se 


> pdg; — Pjlg, p t) 5( Q; dqr + Q; dps) = d®(q,p,t) (t fixo), (8.2.4) 
j=1 k=1 Ogh: Opr 


ou seja, 


(A; dg; + B; dp;) = d®(q, p, t) (t fixo) , (8.2.5) 


1 


n 


J 


onde 
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=p-Y PR ., a. (8.2.6) 
j 2 Aq; ne o 


Como está provado no Apêndice D, a condição necessária e suficiente para que o lado 
esquerdo da Eq.(8.2.5) seja uma diferencial exata é a igualdade de todas as derivadas 


cruzadas dos coeficientes das diferenciais dq; e dp;: 


ðA; ðA; OB; ðB; ðA; ðB; 


= . E l = 8.2.7 
OG Oq; Op; Op; Op; Oq ae 
A primeira destas equações fornece 
" OP, 00) 020; “OP, 00) O] 
= LP, Side LP , 8.2.8 
Ll dq Oq; i TA lda; Oq asda) ne 
donde 
0Q,0P, Qi 5) 
i G;(Q,P) = =, =0. 8.2.9 
(ai, glop) | OG ORE one 
De modo análogo, a segunda das Egs.(8.2.7) implica 
"/0Qi0P, Qı a) 
o Pilo pP) = = =0. 8.2.10 
Pi Pikop) 2 Opi Op; Op; Opi Wee 
Finalmente, a terceira das Eqs.(8.2.7) equivale a 
" OP, 00) 020) “OP, 00 020; 
E EP =— -P ! 8.2.11 
Lla qi ' FT >| Ogi Op; Dadp,) ! 


ou seja, 


"OQ: OP; Qi OP, 
7 eis 2:12 
[dis Pjlto,p) = DE dp; Op; à) Á an 
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completando a demonstração do teorema. 


E Exemplo 8.2.1. Prove que a transformação 


Q=7, Q=p+p, P=-— , h=m (8.2.13) 


é canônica. 


Solução. Temos que 


2 
O À/90,0P QƏRA _ 
[a @2](Q,P) = 3 dp dq mn) mx 


2 
001 OP, 901 OP, 
; = ~ 0 
[P1 P2] (Q,P) Em Op2 pə a 


com cálculos análogos mostrando que [g1,72](q,p) = [42, Pıl(Q,p) = 0. Finalmente, 


_ Š 2Q1 AP, _ ƏQi ƏP\ _ DA 
[q1 Pil(Q,P) = 3o Bie OD | = 2pi( IT =l, 


um cálculo semelhante fornecendo [q2, pə] (Q,P) = 1. É desnecessário calcular os demais parênteses 
de Lagrange por causa de sua anti-simetria. Uma vez que as condições (8.2.9) são satisfeitas, a 


transformação é canônica. E 


8.3 Notacao Simplética 


E possível introduzir uma notação compacta que resume todas as equações de Hamilton 
numa única equação matricial. Essa notação é particularmente útil para simplificar certas 
fórmulas e demonstrações que na notação tradicional são bastante complicadas. Seja z 


uma matriz-coluna com 2n elementos 21,...,Z2n, definidos por 


AG » =D , t=1...,n. (8.3.1) 
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Em palavras: os n primeiros z’s são os n q’seos n últimos z’s são os n p's. Analoga- 


mente, a matriz OH/Oz é uma coluna com os seguintes elementos: 


9H 9H OH OH 
(am). Cae 


A R f z E o us A isa (8.3.2) 


Seja, finalmente, J a matriz (2n) x (2n) definida por 


j= ( ae (8.3.3) 


onde O é a matriz nxn com todos os elementos nulos e I é a matriz identidade nxn. 


As equações (7.1.9) podem ser expressas sucintamente como 


Red (8.3.4) 
conhecida como forma simplética! das equações de Hamilton. 
E Exercício 8.3.1. Mostre que (8.3.4) equivale às equações de Hamilton na forma usual. E 


A matriz J possui as seguintes propriedades, cuja verificação é deixada a cargo do 
leitor: 
(1) J? = —T, onde I é a matriz identidade (2n) x (2n); 
(2) JTJ=JJT =I > J'=J’=-J (J é uma matriz ortogonal); 
(3) det J = 1. 


Com um agrupamento análogo das variáveis transformadas (Q, P) para formar a 


matriz-coluna 4 com 2n linhas, uma transformação no espaço de fase escreve-se 


¢ =C(z,t) (8.3.5) 


ou, em componentes, 


Esta palavra foi introduzida pelo matemático Hermann Weyl em 1939 e deriva de uma raiz grega que 
significa “entremeado” ou “entrelaçado”. 
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Ck = Glz..o2amt) , k=1,...,2n. (8.3.6) 


Com esta notação podemos escrever 


(8.3.7) 


E Exercício 8.2.2. Comprove que (8.3.7) é equivalente ao parêntese de Lagrange [u, v](q,p) 


conforme a Definição 8.2.1. E 


Lema 8.3.1. Em notação simplética, as condições de canonicidade (8.2.9) podem ser 


postas na forma concisa [2,., Zs] Er 5 ee 


Demonstração. Se r,s € {1,...,n} ou r,s E€ {n+1,...,2n} o lado esquerdo de 
(8.3.7) reduz-se aos parênteses de Lagrange dos q's entre si ou dos p's entre si e o lado 
direito é nulo, ao passo que se r = i € {1,...,n} e s = (n+ j) € {n+ 1,...,2n} a 


Eq.(8.3.7) reduz-se a [q;, p;l(0,P) = Jin+j = ij- A inversão dos papéis de r,s repete este 


último resultado devido à anti-simetria de Jrs. o 


Seja, agora, M a matriz jacobiana da transformação (8.3.5), isto é, 


OG, 
Mps = “ f (8.3.8) 
Podemos escrever 
2n OC, OC, 2n 
er, zol ¢ = do, Tt E XO Mer Ju Mis , (8.3.9) 
kl=1 O2r Ss kl=1 


ou, apelando para a definição de produto de matrizes, 


[zr zs]¢ = (MIM), . (8.3.10) 
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Teorema 8.3.1. A transformação (8.3.5) é canônica se e somente se sua matriz 


jacobiana satisfaz 
M'JM =J. (8.3.11) 


Demonstração. Combine (8.3.10) com o Lema 8.3.1 e o Teorema 8.2.2. m 


Qualquer matriz que satisfaz a condição simplética (8.3.11) é dita uma matriz simplética. 
Cumpre chamar a atenção para a semelhança entre a Eq.(8.3.11) e a condição (6.1.20) que 
caracteriza uma transformação de Lorentz. A condição simplética pode ser utilizada para 


testar diretamente se uma dada transformação é canônica. 


E Exemplo 8.2.2. Prove que a transformação Q = (q — p)/V2, P = (¢+p)/V2 é canônica. 


Solução. Temos que 


1 1 1 0 1 1 -l 
T air = 
MIM = 3 (| ae ae i? 
comprovando a natureza canônica da transformação . E 


Teorema 8.3.2. O determinante da matriz jacobiana de uma transformação canônica 


é igual a +1. 
E Exercício 8.3.2. Demonstre o Teorema 8.3.2. E 


É possível ir mais além e provar que o determinante da matriz jacobiana de qualquer 
transformação canônica é igual a +1 (Landau e Lifchitz 1966), mas não necessitaremos 


desse resultado mais refinado. 


A notação simplética simplifica substancialmente a demonstração de uma importante 


propriedade de invariância dos parênteses de Lagrange. 


Teorema 8.3.3. Os parênteses de Lagrange são invariantes sob transformações canônicas, 


isto é, se a transformação z — Ç é canônica então 


lu, v]z = lu, o]¢ ; (8.3.12) 
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Demonstração. Note inicialmente que, pela regra da cadeia, 


Oe NEO Oa SN O 


— = Ma 8.3.13 
Ou > Oz, Ou x Ou ( ) 
ou, em notação matricial, 
oç Oz 
—=M—. 8.3.14 
Ou Ou ( ) 


Levando este resultado em (8.3.7) somos conduzidos a 


moe = (Se) aS (Z MMS = (ZIZ uva, (8815) 
onde usamos (8.3.11). 
E Exercício 8.3.3. Usando J? = —I e o fato de a inversa de uma matriz pela esquerda 
coincidir com a inversa pela direita, mostre que 
MIM” =J (8.3.16) 
é uma conseqiiéncia de (8.3.11). E 


Das Egs.(8.3.11) e (8.3.16) deduz-se facilmente que as transformações canônicas for- 
mam um grupo:(i) a transformação identidade é canônica; (ii) o produto de transformações 
canônicas é associativo; (iii) duas transformações canônicas sucessivas constituem uma 
transformação canônica; (iv) a inversa de uma transformação canônica é uma trans- 


formação canônica. 


EH Exercício 8.3.4. Prove que as transformações canônicas formam um grupo. E 


O conjunto de todas as matrizes (2n) x (2n) que satisfazem (8.3.11) constitui o grupo 


real simplético Spon(R) sobre o espaço R”. 
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8.4 Parênteses de Poisson 


Seja F(g,p,t) uma variável dinâmica arbitrária, isto é, uma função qualquer das 


variáveis canônicas e do tempo. Então 


“OF 0H. OF ƏH; OF 
E DG Opr Op Ba) * 


tendo sido usadas as equações de Hamilton. O parêntese de Poisson {F,G} de duas 


variáveis dinâmicas F e G é definido por 


"(OF ðG OF ðG 
pe e 8.4.2 
Mines Eloa Ope pk ro, ( ) 
de modo que 
TT ee aie (8.4.3) 


Em particular, tomando primeiro F = q; e em seguida F = p;, resultam as equações de 


Hamilton em termos de parêntes de Poisson: 


G={% H} ,  pi={p H}, (8.4.4) 


porque, para ambas as escolhas, F não apresenta dependência temporal explícita. 


Uma das principais vantagens para análises teóricas de se escrever a equação de movi- 
mento de uma variável dinâmica arbitrária na forma (8.4.3) reside na propriedade do 
parêntese de Poisson de ser invariante sob transformações canônicas. Em outras palavras, 
a Eq.(8.4.3) independe do conjunto de variáveis canônicas escolhido para descrever a 
dinâmica. Para abreviar a demonstração da invariância do parêntese de Poisson é conve- 


niente reescrevê-lo em notação simplética na forma 


OF YT - OF | OG 
{F,G}2 = ( a) =e ‘pe T (8.4.5) 
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o subscrito indicando cálculo relativamente às variáveis canônicas z = (q, p). 
Teorema 8.4.1. O parêntese de Poisson é invariante sob transformações canônicas, 
isto é, 


{FG}, = {F,G}¢ (8.4.6) 


se a transformação z — Ç é canônica. 


Demonstração. De acordo com a regra da cadeia, 


OF 2 a¢, OF OF _ qr OF 


Oz, “dz, Om OC” Gee 
Conseguentemente, 
OF yT. OG OF \T roG OFT 0G 
{FG}. = (55) = = (5z) MJM a o) Ix ={F,G}e, (848) 
onde usamos a Eq.(8.3.16). O 


Os parênteses de Lagrange e de Poisson são reciprocamente inversos no seguinte sen- 
tido. 


Teorema 8.4.2. Seja u, = u(21,...,29n), k = 1,...,2n, um conjunto de 2n funções 
mutuamente independentes, de modo que, reciprocamente, 2, = z,(u1,..., Um). Então 
2n 
X tubs [tes Us|z = One . (8.4.9) 
k=1 


Demonstração. Segundo (8.3.7) e (8.4.5), 


2n 2n Qn 2n 
Ou, Ouk Ozi Oz; 
T = > Ur, U Uk, Uslz = > ) ) J pees 
rs dA T3 klz] k> ale reat or Pera ax lm zn ðu; ij ðu, 
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2m 2m Onis, Oui | 2n Bile dz 
E po da a Zm Jij A Do Jim Jmj T 


onde usamos a regra da cadeia da diferenciação e 0z;/0Z%m = dim - Por outro lado, 


2n 
DD Jim Jmj = (3º),; = (CI); = Oy , 
m=1 


donde 


an Our 5 Oz; o. 22 Our O21 Ou, 
“ho A z —ôrs 
Oz du dus Oz dus Ous 


=1 


i — 


Lj=1 


pois os u's são mutuamente independentes por hipótese, e a demonstração do teorema 


está completa. 


Em virtude deste resultado, é possível reformular o critério básico de canonicidade 


para transformações no espaço de fase em termos de parênteses de Poisson. 


Teorema 8.4.3. A transformação (8.3.5) é canônica se e somente se 


{Crs Gata = J; rs ; (8.4.10a) 


ou, em notação tradicional, 


{Q Qian =9 » {Pa Pikan 0, {Qi Pikap = dy - (8.4.10b) 


Demonstração. Sejam X e Y matrizes cujos elementos são {¢,,¢s}2 €e [Gr Gslz; 
respectivamente. Em linguagem matricial a Eq. (8.4.9) equivale a XY = —T. Como a in- 


versa de uma transformação canônica é também uma transformação canônica, o Teorema 
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8.2.2, com os papéis das variáveis novas e antigas intercambiados, afirma que a trans- 
formação (8.3.5) é canônica se e somente se Y = J. Mas, como J? = —T, segue-se 


imediatamente que X = J see somente se Y = J, completando a demonstração do 


teorema. 


E Exercício 8.4.1. Considere um sistema mecânico com um único grau de liberdade. Usando 
o critério dos parênteses de Poisson, prove que a transformação 


Q = de ; P = qcot p (8.4.11) 


é canônica. = 


Os parênteses de Poisson são de enorme importância devido ao papel fundamental 
que desempenham na transição da teoria clássica para a teoria quântica. A chamada 
quantização canônica consiste essencialmente em associar um operador a cada variável 
dinâmica, com o comutador de dois operadores correspondendo ao parêntese de Poisson 
clássico multiplicado por ih. Essa correspondência é possível porque os parênteses de 


Poisson gozam das mesmas propriedades algébricas que os comutadores, a saber: 


Pl 
P2 
P3 
P4 


Anti-simetria: (4,B)= —(B,A) donde {A,A}=0. 
Linearidade: {A +aB,C} = {A,C}+a{B,C}, a independente de (q, p). 
{AB,C}=A{B,C}+{A,C}B ; {A,BC}={A,B}C+ B{A,C}. 


( 
( 
( 
(P4) Identidade de Jacobi: {{A, B},C}+{{B,C}, A} + {{C, A}, B} =0. 


RE AE NE NA 


Exceto a identidade de Jacobi, cuja demonstração direta requer um longo trabalho algébri- 
co, as demais propriedades são de demonstração fácil e rápida, ficando como exercício para 
o leitor. Reservamos para a próxima seção uma prova curta e virtualmente sem cálculos 


da identidade de Jacobi. Uma propriedade adicional que merece menção é 


OB 
ay? 


a DA 
aA, B} = {5 BIA, (8.4.12) 


onde A é um dos q's, um dos p’s, o tempo t ou um outro parâmetro qualquer. 


Os parénteses de Poisson fundamentais 


(a gk=0, {pp} =0 , {qopi} = bi , (8.4.13) 
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juntamente com as propriedades P1 a P4, permitem, em muitos casos, o cálculo de 
parênteses de Poisson por métodos puramente algébricos, sem a necessidade de recurso 
à definição (8.4.2). Por outro lado, como a análise anterior demonstrou, a invariância 
dos parênteses de Poisson fundamentais é condição necessária e suficiente para que uma 


transformação no espaço de fase seja canônica. 


Uma álgebra de Lie consiste num espaço vetorial de elementos X,Y,... no qual está 
definido um “produto” bilinear [X,Y] que satisfaz a propriedade de anti-simetria e obe- 
dece à identidade de Jacobi (Sternberg 1994). Assim, as funções infinitamente diferenciá- 
veis sobre o espaço de fase, dotado da estrutura dos parênteses de Poisson, geram uma 


álgebra de Lie. 


8.5 Transformações Canônicas Infinitesimais 


Uma transformação canônica infinitesimal é da forma 


Q=-un+óg=qun+efilg, p, t) , P; = pi bp, = pi + €gi(q, O) , (8.5.1) 


onde e é um parâmetro infinitesimal. Substituindo esta equação em (8.2.1) resulta 


ou, desprezando termos de segunda ordem em € e escrevendo ® = eF, 


> (9: dg + pidf;) = —dF . (8.5.3) 


1 


Esta equação pode ser reescrita na forma 


> (g: dqi — fi dpi) = —dG , (8.5.4) 


KA 


onde 
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GS pi: (8.5.5) 
De (8.5.4) deduz-se de imediato 
OG OG 
= e ss 8.5.6 
f= Sp =D (8.5.6) 
ou seja, 
OG OG 
6g; = € Dp, f Op; = —€ da (8.5.7) 


Em termos de parênteses de Poisson estas equações tomam a forma 


ou, em notação simplética, 


dz = eta, Gh. (8.5.9) 


A função G(q,p,t) é chamada de função geradora da transformação canônica infinitesimal. 


E Exercício 8.5.1. Mostre que (8.5.7) e (8.5.8) são equivalentes. E 


De fundamental importância é a transformação canônica infinitesimal gerada pela 


hamiltoniana H com parâmetro e = dt. Neste caso as Eqs.(8.5.8) fornecem 


bq =dt{q,H}=qdt  , 6p, = dt {p;, H} = pi dt , (8.5.10) 


onde usamos (8.4.4). Conseqiientemente, 


Qilt) = qilt) + dai(t) = gilt) + quit) dt = q(t + dt) , (8.5. 11a) 
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Pit) = pi(t) + dpi(t) = pilt) + pilt) dt = pi(t + dt) , (8.5.11b) 


isto é, a transformação canônica infinitesimal gerada por H leva os valores dos q’s e p's 
no instante t em seus valores no instante t+dt. Assim, a evolução do sistema mecânico de 
seu estado no instante t para seu estado no instante t +dt é uma transformação canônica 
infinitesimal gerada pela hamiltoniana do sistema. A evolução temporal num intervalo de 
tempo finito é uma transformação canônica que consiste numa sucessão de transformações 


canônicas infinitesimais geradas por H . Note que, usando (8.5.5) com G = H, 


d=eF=di(H-S p,q) = —Ldt (8.5.12) 


para a transformação canônica infinitesimal gerada por H. Da Definição 8.2.1 vê-se 
facilmente que a função associada a duas transformações canônicas consecutivas é a soma 
das funções associadas às transformações individuais. Logo, para a evolução temporal num 


intervalo de tempo finito, 


6=—/ Ldt=-S, (8.5.13) 


onde S é a ação. Em outras palavras, —S gera uma transformação canônica que evolui o 
estado do sistema no instante inicial ty ao seu estado num instante genérico t. Ainda da 
Definição 8.2.1, é fácil perceber que —& gera a inversa da transformação canônica gerada 
por ®. Logo, encarada como função geradora, a ação S engendra uma transformação 
canônica que traz o estado do sistema no instante genérico t ao seu estado num instante 
inicial fixo to, isto é, as novas variáveis canônicas resultantes da transformação gerada 
por S são constantes. Esta notável propriedade da ação S será confirmada pela teoria 


de Hamilton-Jacobi, d ser desenvolvida no próximo capítulo. 


Retomando a discussão de questões gerais, a variação infinitesimal du de uma variável 


dinâmica u(q,p,t) é definida por 


Ou Ou 


ou, usando (8.5.7), 
du = e {u, G} . (8.5.15) 
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Ao escrever (8.5.14) adotamos o ponto de vista ativo, ou seja, encaramos a transformação 
(8.5.1) como levando o ponto (q,p) ao novo ponto (q + ôq, p + dp) do mesmo espaço de 


fase. Isso induz uma mudança ôu na variável dinâmica u de acordo com (8.5.15). 


Incidentalmente, esta última equação proporciona uma demonstração elegante e con- 
cisa da identidade de Jacobi (Lemos 2000a). Por um lado, dada uma transformação 


canônica infinitesimal gerada por G(q, p), tomando u = (E, F} temos 


5{E, F} =eME, F},G} , (8.5.16) 


onde E(q,p) e F(q,p) são duas variáveis dinâmicas quaisquer. Por outro lado, como 
o parêntese de Poisson (E, F} independe das variáveis canônicas utilizadas para o seu 


cálculo, sua variação deve-se exclusivamente às variações de E e F, de modo que 


E, F} = {6E, F} + {E, ôF} , (8.5.17) 


donde 
HE, F} = e{{E, G}, F} +E, {F,G}}. (8.5.18) 


Comparando (8.5.16) com (8.5.18) e fazendo rearranjos simples, resulta a identidade de 


Jacobi 


HE PLCAMCELDA ME OGE =U (8.5.19) 


Tome agora u = H e suponha que G não dependa explicitamente do tempo. Neste 


caso, a Eq.(8.5.15) torna-se 


ôH =e{H,G}=-e— , (8.5.20) 


onde usamos (8.4.3). Desta equação inferimos que se H é invariante (0H = 0) sob 
uma transformação canônica infinitesimal, sua função geradora é uma constante de movi- 
mento. Reciprocamente, cada constante de movimento gera uma transformação canônica 
infinitesimal que deixa H invariante. Por exemplo, se H não depende de uma determi- 
nada variável q, então 6H = 0 sob a transformação Qi = q; + €d;x, cuja função geradora 


é G = pk. Logo, pk é constante de movimento, resultado já velho conhecido nosso. 
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Uma propriedade importante das constantes de movimento está contida no resultado 


a seguir. 


Teorema de Poisson. O parêntese de Poisson de duas constantes de movimento é 
também uma constante de movimento. 
Demonstração. Se F e G são constantes de movimento, 


or 
ət 


oc 


(PH) + 0, (GH SO. 


Logo, 


d o OF OG 
a (@GrS EG) BPE (BG) = (BC) A a Cb) 


= {{F, G}, H} + UH, F},G} + {{G, H}, F} =0 


em virtude da identidade de Jacobi. 


As vezes é possível gerar novas constantes de movimento pelos parênteses de Poisson 
de constantes de movimento já conhecidas. Frequentemente, no entanto, tais parênteses de 
Poisson são identicamente constantes ou funções das constantes de movimento previamente 


conhecidas. 


E Exemplo 8.5.1. Um projétil move-se no plano xy num campo gravitacional constante com 
hamiltoniana H = (p2 +pi)/2m + mggy . Prove que F = y—tp,/m-—gt?/2 e G=x—tp,/m são 
constante de movimento e obtenha novas constantes de movimento por intermédio do teorema 
de Poisson. 


Solução. Temos 


dF OF | t Bica ar i E Py a 
dE T EE + oy = E O toy H) E gt = = mg) gt =0 


e, analogamente, 
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dG aG t Pz 
1 ={G,H}+ = ={2,H}——{p.,H = 
q OH+ tuto ol 


Pe q 
m m 


=0. 


O parêntese de Poisson {F,G} = 0 fornece uma constante de movimento trivial. Mas H é 
constante de movimento, pois não depende explicitamente do tempo, de modo que 


t p 
M = {F, H} = {y, H} — —{py, H} = + gt 
m m 


e também 


t p 
N = {G, H} = {x, H} = m Pa H} = 
são novas constantes de movimento. Note que as cinco constantes de movimento F, G, M, N, H 


não podem ser independentes (por qué?). = 


E Exercício 8.5.2. Mostre que H = mN?/2 + mM?/2 + mgF, o que prova que H não é 


independente das demais constantes de movimento. E 


Se u(q,p) é uma variável dinâmica que não depende explicitamente do tempo, e o 
mesmo se dá com a hamiltoniana do sistema, é possível obter-se uma solução formal da 
equação de movimento para u na forma de uma série de potências de t cujos coeficientes 
envolvem parênteses de Poisson sucessivos entre u e H. Isto realiza de maneira explícita 
a transformação canônica finita do estado inicial em t = O ao estado num instante genérico 
t como uma sucessão de transformações canônicas infinitesimais geradas por H. De fato, 


temos 


er = tu, H io = tu, H}, , (8.5.21) 
du d 
eae (5, {4 ED o ={{u, H}, H}, . (8.5.22) 
Por indugao , 
(co = Lu A Do . (8.5.23) 
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Supondo que u admita expansão em série de Taylor em torno de t = 0, resulta 


u(t) = uo +t{u, H}, + Mu), + Ë (lu H}, E} H}, +e, (8.5.24) 


que é a solução formal da equação de movimento para u. Na maioria das situações é 
difícil somar esta série de modo a obter uma solução em forma fechada. Em alguns casos 
simples, todavia, a série pode terminar após o cálculo de um número finito de coeficientes, 


ou pode ser possível somá-la em termos de funções elementares. 
E Exemplo 8.5.2. Dada uma partícula sujeita a uma força constante F, cuja função hamil- 
toniana é H = p2/2m — Fx, encontre x(t) usando a Eq.(8.5.24). 


Solução. Temos 


{c,H}=2 | {{2,H},H}= =p, H} = -* {p,a} me 


m m` 


Como F = constante , todos os demais parênteses de Poisson são nulos, de modo que 


t? Po F 2 
x(t) = to +t{z, H}, + 5 te, H}, H} Sid ts” 


que é a solução elementar bem conhecida. E 


Comentário. Na mecânica quântica na representação de Heisenberg um operador 


Ô H satisfaz 


dOy ôy 1 


dt O ih 


(On, H] , 


onde [A,B] = AB — BA é o comutador de dois operadores. A similaridade entre esta 
equação e a Eq.(8.4.3) é marcante. A mecânica formulada na linguagem dos parênteses de 
Poisson é o análogo clássico da teoria quântica na representação de Heisenberg. Além disso, 
o comutador quântico dividido por ih corresponde ao parêntese de Poisson clássico. Essa 


correspondência é consistente porque o comutador quântico tem exatamente as mesmas 
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propriedades algébricas que o parêntese de Poisson clássico. A regra de quantização que 


faz corresponder ifi{A,B} a [A,B] foi descoberta por Dirac em 1926 (van der Waerden 
1967). 


8.6 Parénteses de Poisson do Momento Angular 


Os parénteses de Poisson das componentes do momento angular L entre si ou com um 
vetor arbitrário F podem ser obtidas sem cálculos diretos por um método extremamente 
elegante inventado por Julian Schwinger, baseado no papel de L como gerador de rotações. 
Uma rotação anti-horária de um ângulo d0 do vetor posição r de uma partícula em torno 
do eixo z é gerada por L,. Para comprovar isto, note que a referida rotação do vetor 
(ponto de vista ativo) equivale a uma rotação horária dos eixos coordenados (ponto de 
vista passivo). Assim, substituindo ¢ por —dé@ na fórmula (3.1.19) de rotação dos eixos 


coordenados, resulta 


X=v—-ydd , Y=ad0+y , Z=z, (8.6.1) 
donde 
ôx =-—ydo , dy=zdo , d2=0. (8.6.2) 
É imediato que 
ôx = db {x, bsb 5 ðy= dou ie) , ôz= d0 {z, bas (8.6.3) 


com L, = Tp, — YPz - 


E Exercício 8.6.1. Verifique que (8.6.3) equivale a (8.6.2) e estenda o resultado a um sistema 
de n partículas, isto é, prove que a transformação canônica infinitesimal 62; = —y;d0 , dy; = 


xid , dz; = 0 é gerada pela componente z do momento angular canônico L = X prk X pe. H 
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Mais geralmente, o gerador de rotações em torno da direção definida pelo vetor unitário 
ñ é L-n (demonstração: o eixo z sempre pode ser escolhido ao longo do vetor ñ). 


Portanto, para um vetor F arbitrário, 


ôF = do (F,L-n). (8.6.4) 
Por outro lado, sabemos que 
ôF =ddnxF , (8.6.5) 
donde 
{F,L-n}=nxF , (8.6.6) 


que é o resultado genérico procurado. Ressalte-se que esta última equação vale para 
qualquer vetor F do sistema, isto é, que possa ser expresso como função unicamente das 
variáveis canônicas do sistema, porque ôF tem seu significado definido pela Eq.(8.5.14). 
Se F depender de algum vetor externo — um campo magnético constante, por exemplo 
— que não é afetado por uma rotação das variáveis canônicas do sistema, a Eq.(8.6.6) não 


se aplica. 


A partir de (8.6.6) diversos resultados interessantes podem ser obtidos. Escolhendo, 


por exemplo, F=p e n= k resulta 


{p, L.} = k x p = -på + paj , (8.6.7) 


ou, em componentes, 


{pz, Lz} = —Py ; {py Lz} = Pr ; [Das Lz} =0. (8.6.8) 


Os parênteses de Poisson de p com L, e L, podem ser facilmentes obtidos pelo mesmo 


procedimento anterior. 
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E Exercício 8.6.2. (i) Tomando F =L e ñ sucessivamente igual a i,j,k, prove que 
(Lo, Ly} = Lz ; (8.6.9) 


os demais parênteses de Poisson sendo obtidos permutando ciclicamente xyz. (ii) Demonstre o 
seguinte teorema: se duas componentes do momento angular são conservadas, então a compo- 


nente restante é necessariamente conservada.? E 


Como último resultado interessante, note que um escalar é invariante sob rotações, 
portanto 
{F-G,L-ñû}=0 (8.6.10) 


quaisquer que sejam os vetores F e G do sistema. 


E Exercício 8.6.3. Verifique a identidade {F : G, A} = F - {G, A} + {F, A} - G e use-a para 
demonstrar (8.6.10) diretamente. E 


8.7 Teoremas de Liouville e de Poincaré 


Seja R uma região do espaço de fase (q,p) que é mapeada na região R’ do espaço de 


fase (Q, P) por uma transformação canônica. O “volume” Q da região R é definido por 


a= | dq, ...dqndps...dpn = f Pro (8.7.1) 
R R 


Analogamente, 


= dQ) ...dQndP,...dPy = f Pre. (8.7.2) 
R! R' 


Segundo o conhecido teorema de mudança de variáveis numa integral múltipla, temos 


=, Pr = [jee + Son) lero. (8.7.3) 


(2, a , 22n) 


2Este teorema só é verdadeiro na ausência de vínculos. Se houver vínculos o teorema não se aplica, 
como contraexemplos elementares permitem constatar (Corben & Stehle 1960, p. 229). 
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Figura 8.7.1: Evolução dinâmica de uma região do espaço de fase. 


o jacobiano da transformação sendo dado por 


OEE ... 00 

Oz Ozn 
SlCr- Gan) _ Loro: | = detM , (8.7.4) 
olz, ar Zon) Olan alon 

da O Don 


onde M é a matriz jacobiana da transformação canônica (q, p) — (Q, P). Mas, de acordo 
com o Teorema 8.3.1, det M = 1 donde 


w aJa = | dez Se (8.7.5) 


e o volume de qualquer região do espaço de fase é invariante sob transformações canônicas. 


Se Ro é uma região do espaço de fase no instante tọ com volume Qo e R, é a região 
no instante t obtida levando cada ponto de Ro no ponto correspondente de R, por meio 


da evolução temporal gerada pela hamiltoniana (Fig. 8.7.1), então 


O = Vo , (8.7.6) 


pois a evolução temporal é uma transformação canônica. Esta última equação é conhecida 
como teorema de Liouville, o qual assegura que a evolução dinâmica preserva o volume de 


qualquer região do espaço de fase. 
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Na mecânica estatística um ponto do espaço de fase de um sistema clássico (um gás 
contido num recipiente, por exemplo) é chamado de um ponto representativo e repre- 
senta um microestado do sistema. Um sistema sob determinadas condições macroscópicas 
(macroestado) corresponde não a um único estado microscópico, mas a um vasto número de 
microestados. Uma coleção de sistemas idênticos em composição e situação macroscópica, 
mas em diferentes microestados, denomina-se um ensemble, que se descreve por uma den- 


sidade o(q,p,t) de pontos representativos no espaço de fase. Mais precisamente, 


o(q, p,t) d"qd"p (8.7.7) 


é o numero de pontos representativos que no instante t estao contidos no elemento de 
volume d"qd"p do espaço de fase centrado no ponto (q,p). O teorema de unicidade 
para as equações de Hamilton assegura que o número de pontos representativos num dado 
elemento de volume é preservado pela evolução temporal. Em outras palavras, cada ponto 
(q,p) no instante t é produto da evolução dinâmica de um único ponto (go, po) num 
instante anterior to. Como o volume do elemento também é conservado pela evolução 


temporal, o teorema de Liouville é equivalente a 


do do 
— = — tloHt=O, 8.7.8 
e a distribuição de pontos representativos move-se como um fluido incompressível no espaço 
de fase. Um ensemble é dito estacionário se o não depende explicitamente do tempo, isto 
é, 


ay (8.7.9) 


Neste caso o valor médio de qualquer grandeza física é independente do tempo, de modo 
que um ensemble estacionário representa um sistema em equilíbrio. Pela Eq.(8.7.8), a 
densidade o de um sistema em equilíbrio tem parêntese de Poisson zero com H. Esta 
condição é assegurada tomando-se o como uma função das constantes de movimento do 
sistema que não dependam explicitamente do tempo. Para sistemas conservativos, uma 
função qualquer da energia dá conta do recado. O ensemble microcanônico é caracterizado 
por o(q,p) = constante para microestados de uma dada energia e zero em caso contrário, 
que realiza o postulado das iguais probabilidades a priori para um sistema isolado. No 
caso de um sistema em equilíbrio térmico com um sistema maior, a escolha adequada é 


o(q, p) x exp|—H(q, p)/k®] , que define o ensemble canônico (Huang 1963; Pathria 1972). 
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Embora também desempenhe um papel relevante na concepção de grandes aceleradores 
de partículas (Corben & Stehle 1960), é na mecânica estatística que o teorema de Liouville 
encontra suas aplicações mais importantes. Conforme observamos antes, o movimento no 
espaço de fase assemelha-se ao de um fluido incompressível. Mas um fluido incompressível 
não pode ter fontes nem sorvedouros. Consequentemente, se o espaço de fase disponível 
para o movimento for limitado, as trajetórias de cada ponto do fluido de fase retornarão 


sobre si próprias infinitas vezes. 


Teorema da Recorrência de Poincaré. Seja g uma aplicação bijetiva, contínua, 
que conserva volumes e deixa invariante um domínio limitado D de um espaço euclidiano: 
gD = D. Então em toda vizinhança U de um ponto qualquer de D existe um ponto 
x EU que retorna a U depois de um número finito de aplicações de g, isto é, 9x € U 


para algum inteiro positivo n. 


Demonstração. Como D é limitado, seu volume é finito. Considere, como na Fig. 


8.7.2, a vizinhança U e suas imagens 


U, gU, PU,..., FU. 


Como todos estes conjuntos possuem o mesmo volume, eles não podem ser disjuntos para 
todo n, senão o volume de D seria infinito. Logo, existem números inteiros positivos 
k,l, com k > l, tais que g"UNg'U + À. Equivalentemente, g*x = g'y para algum 
par de pontos x,y € U. Aplicando g~! a ambos os lados desta última igualdade resulta 


glx = y com xz EU e y EU. Portanto, gx EU para n = k — l> 0 ea demonstração 


está completa. 


O teorema é válido, por exemplo, para um gás ideal contido num recipiente de volume 
V, cujos microestados admissíveis estão restritos ao domínio limitado do espaço de fase 
definido pelas condições de que todas as N moléculas permaneçam no interior do recipiente 
e E< H(q,p) < E + AE, ou seja, 


2ME < p? +pi +- + ph <2m(E+AE) . 


Neste caso, a aplicação de interesse é a evolução temporal gf gerada por H(q,p) que 
mapeia um ponto do espaço de fase no instante t = O em sua imagem no instante t, isto 


é, g (q(0), p(0)) = (q(t), p(t)), e, pelo teorema de Liouville, preserva volumes. Um gás 
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Figura 8.7.2: Teorema da recorrência de Poincaré. 


ideal volta infinitas vezes a um estado arbitrariamente próximo de qualquer estado inicial 
escolhido, e essa dinâmica quase periódica dá lugar a um aparente paradoxo. Se um gás 
ideal ocupa a metade de um recipiente e é retirada a parede que impedia a sua expansão 
para a outra metade, ele rapidamente ocupa todo o volume disponível. De acordo com o 
teorema da recorrência de Poincaré, depois de “algum tempo” todas as moléculas do gás 
retornarão à primeira metade do recipiente, em aparente contradição com a segunda lei 


da termodinâmica. 


Dificuldades desse gênero estavam na raiz da controvérsia em que se envolveram, no 
crepúsculo do século XIX, o matemático Ernst Zermelo? e o físico Ludwig Boltzmann, que 
havia demonstrado a segunda lei da termodinâmica na forma do seu célebre teorema H 
(Cercignani 1998). Segundo Zermelo, por causa do teorema da recorrência de Poincaré 
um estado de equilíbrio jamais seria atingido por um gás. A fim de provar que o teorema 
de Poincaré não tinha as implicações físicas propaladas por Zermelo, Boltzmann estimou 
o tempo de recorrência para um gás de 10!º partículas numa caixa de 1cm? como 1010" se- 
gundos, um número inconcebivelmente grande (a idade atualmente presumida do Universo 
é “apenas” 10!” segundos). Boltzmann argumentou que não havia paradoxo destacando 
a natureza estatística do seu teorema: os microestados que depois de um certo tempo 


conduzem a um macroestado de equilíbrio constituem a esmagadora maioria. 


Vale sublinhar, também, que nem sempre a conservação da energia é suficiente para 
definir um domínio de volume finito do espaço de fase que permita a aplicação do teo- 
rema da recorrência de Poincaré. No caso em que a energia potencial de interação entre 


as moléculas do gás pode tornar-se arbitrariamente grande, não são conhecidos domínios 


3Que se tornaria famoso pelo axioma da escolha e por outras contribuições à teoria dos conjuntos. 
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invariantes do espaço de fase com volume finito. As trajetórias que escapam para o in- 
finito preenchem uma larga porção do espaço de fase e a elas não se aplica o teorema da 
recorrência. No entanto, como o fluido de fase não pode ser comprimido, é possível provar 


que quase todas as trajetórias que vêm do infinito retornam para lá (Thirring 1997). 


8.8 Sistemas Hamiltonianos Vinculados 


A transição da formulação lagrangiana para a hamiltoniana requer que as velocidades 
generalizadas possam ser expressas univocamente em termos dos momentos canônicos. 
Como vimos na Seção 7.1, isso não é possível se a matriz hessiana (7.1.3) é singular. Todas 
as teorias físicas modernas de significado fundamental são descritas por lagrangianas com 
matriz hessiana singular, o que justifica uma introdução à dinâmica hamiltoniana de tais 
sistemas. Nosso tratamento segue de perto a lúcida exposição de Dirac, que vem a ser o 


criador da teoria dos sistemas hamiltonianos com vínculos (Dirac 1964). 


Considere um sistema descrito por uma lagrangiana L(q,q) sem dependência temporal 


explícita. Se a matriz hessiana é singular, isto é, 


detW=0 , (8.8.1) 


então as equações definidoras dos momentos canônicos não podem ser todas resolvidas para 
as velocidades em função dos momentos porque não constituem um conjunto de equações 
independentes. Como consegjiiência, aparecem relações funcionais entre as coordenadas e 


momentos do tipo 


Op Gp) =0 , m=1,..., M. (8.8.2) 


Por causa destas equações, os q’s e p’s, que são as variáveis dinâmicas básicas do formal- 
ismo hamiltoniano, não são mutuamente independentes. As relações (8.8.1), decorrentes 


unicamente da forma da lagrangiana, são chamadas de vínculos primários. 


E Exemplo 8.8.1. Dada a lagrangiana 


L= olé - 4)? , (8.8.3) 
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encontre os vínculos primários. 


Solução. A matriz hessiana 


aL aL 

Oa? OxOy T =] 
W = = 1 1 

PL OL E 

OyOL Oy? 


é claramente singular. Os momentos canônicos são dados por 


ðL . ðL ke ss 
BSa eR RO (8.8.4) 


Estas equações não são independentes entre si, e delas se deduz 
b=Prt+Py=0, (8.8.5) 
que é um vínculo primário. E 


A hamiltoniana é definida da forma usual H = 5piji— L e a Eq.(7.1.7) permanece 
válida, mostrando que mesmo na presença de vínculos a hamiltoniana é uma função 
somente dos q’s e p’s. Como já sabemos, na presença de vínculos primários devemos 


empregar a hamiltoniana modificada 


M 
Hr=H + Y Ambm ; (8.8.6) 


m=1 


que incorpora os vínculos por meio dos multiplicadores de Lagrange Am. As equações de 


Hamilton oriundas do princípio variacional 


sf (So pidi — Hr) dt = sf (E pidi- H — Y Amm) at = 0 (8.8.7) 
são 


OH Pm 
Dp, + 3 AU (8.8.8a) 


Di 


di = 
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. SO 
Pi = a 


ye ee | (8.8.86) 


qi m qi 
com as condições subsidiárias (8.8.2). 


A fim de escrever as equações de Hamilton (8.8.8) na notação compacta dos parênteses 
de Poisson, é útil introduzir a noção de igualdade fraca, denotada pelo símbolo “~”. 


Escrevemos inicialmente as equações de vínculo na forma 


dm(9;p) = 0 (8.8.9) 


para sublinhar que cada quantidade m é numericamente restrita a valer zero mas não 
é identicamente nula em todo o espaço de fase. Em particular, os ¢,, têm parênteses de 
Poisson não nulos com as variáveis canônicas. De modo mais geral, duas funções F,G que 
coincidem na hipersuperfície do espaço de fase definida pelos vínculos øm = 0 são ditas 
fracamente iguais, e escrevemos F x G. Por outro lado, uma igualdade que vale em todo 
o espaço de fase, e não apenas na hipersuperfície m = 0, é dita forte e o símbolo usual 
de igualdade é usado neste caso. Com esses cuidados, a equação de movimento de uma 


função qualquer F(q,p) pode ser escrita na forma 


F = {F,H} +Y àm{F, bm} © {F, Hr} , (8.8.10) 


porque cada termo (Am, F kóm , sendo proporcional a um dos vínculos, é fracamente zero. 
A Eq.(8.8.10) mostra que as equações de vínculo (8.8.2) só podem ser usadas depois de 


calculados todos os parênteses de Poisson em que estivermos interessados. 


Se tomarmos F como um dos ¢,, devemos ter Øm = 0 por consistência: os vínculos 


primários devem ser preservados no tempo. Isto dá lugar às condições de consistência 


Três casos distintos podem ocorrer. 


Caso (i). As condições de consistência são identicamente satisfeitas. Neste caso os 
únicos vínculos da teoria são os vínculos primários ¢,, e os multiplicadores de Lagrange 


são inteiramente arbitrários, de modo que a dinâmica contém funções arbitrárias do tempo. 
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E Exemplo 8.8.2. Discuta as condições de consistência e obtenha a solução geral das equações 
de Hamilton para o sistema descrito pela lagrangiana do Exemplo 8.8.1. 


Solução. A hamiltoniana associada à lagrangiana (8.8.2) é 


H=ipotipy-L=(b-i)p-sp=5P >» (8.8.12) 
onde usamos (8.8.4) e (8.8.5). A condição de consistência 
tó, H} +Aló, o} =0 (8.8.13) 


para o vínculo (8.8.5) é identicamente satisfeita porque {¢,H} = 0. Não há outros vínculos e 
as equações de Hamilton tomam a forma 


tax {z,H}4+A(Aa,¢os}=pr +r , pe ® {pr, H} + Ap, of} =0, (8.8.14a) 
cuja solução geral é py = —py = a, x(t) = y(t) +at+b com a,b constantes arbitrárias e y(t) 
funcao arbitraria. E 


m Exercício 8.8.1. Mostre que a solução geral das equações de Lagrange que derivam da 


lagrangiana (8.8.3) coincide com a solução geral das equações de Hamilton. E 


Caso (ii). As condições de consistência determinam univocamente os multiplicadores 


de Lagrange. Isto se dá se a matriz || (dm, Øm} || não é singular, isto é, se 


det | {Gm, Om H|£O . (8.8.15) 


Neste caso, se || Cm || é a inversa de || (óm, m } ||, temos 


Se Cmm” { Om", Pm } = Oram! : (8.8.16) 


m" 


Então as condições de consistência (8.8.11) fornecem 
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àm S — Chan Ord H} , (8.8.17) 
donde 
F x {F,H} X {F, 9m}Cmm tom, H} . (8.8.18) 


Definindo o parêntese de Dirac 


{F, GF ={F,G}— Y {F, m Comb mr, G} (8.8.19) 


m'm” 


a equação de movimento para uma função arbitrária F(q, p) reduz-se a 


F={F, HYF. (8.8.20) 


Podemos usar o sinal de igualdade forte nesta última equação porque, agora, os parênteses 


de Dirac dos vínculos com qualquer F(q, p) são nulos: 


(E, pm} = AF, Om} — >, {F, dm }Cmim' {Pm Pm} = (E, m} — ye Pm }Omim =0 . 


m'm” m! 


(8.8.21) 


Segue-se que os vínculos podem ser postos iguais a zero na hamiltoniana Hy antes de 
calcular os parênteses de Dirac, de modo que Hr = H e as igualdades fracas podem ser 
tomadas como igualdades fortes. Os parênteses de Dirac têm as mesmas propriedades 


algébricas que os parêntese de Poisson e satisfazem a identidade de Jacobi. 


Caso (iii). As condições de consistência geram vínculos secundários 


xs(g,p)=0 , s=1,...,8. (8.8.22) 


A diferença importante entre vínculos primários e secundários é que os primeiros resultam 
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meramente da forma da lagrangiana e da definição dos momentos, ao passo que os últimos 


exigem o emprego das equações de movimento. Impomos, agora, 


Xs a 1X3; H} T DD Am {Xs, dm } x0. (8.8.23) 


Se recairmos nos casos (i) ou (ii) o processo termina neste estágio. Se isto não aconte- 
cer, aparecem outros vínculos secundários e repetimos o procedimento, conhecido como 
algoritmo de Dirac-Bergmann. Após um número finito de estágios o processo termina e 


ficamos com um conjunto de vínculos secundários denotados por 


MEDSE , ESME eM ERK (8.8.24) 


onde K é o número total de vínculos secundários. Antecipando que a distinção entre 
vínculos primários e secundários será pouco importante para a teoria em sua forma final, 


introduzimos a seguinte notação uniforme: 


dlp) S0 , j=1,..., M+K=J. (8.8.25) 


As condições finais de consistência são 


(o, HFE S Anlon bm} © 0 (8.8.26) 


e impõem restrições aos A’s, já que não geram novos vínculos. O sistema de J equações 
lineares não-homogêneas (8.8.26) para as M < J incógnitas Am deve ser solúvel, caso 
contrário a dinâmica descrita pela lagrangiana original seria inconsistente, hipótese que 


excluimos. A solução geral de (8.8.26) é da forma 


A 
Nn = Un + Y UVO , (8.8.27) 
a=1 
onde Um é uma solução particular das equações não-homogêneas e VD a = 1,...,A, 


são as soluções linearmente independentes das equações homogêneas, isto é, 


Db; dm} VP HO. (8.8.28) 
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Os coeficientes vg em (8.8.27) são inteiramente arbitrários. 


Substituindo (8.8.27) em (8.8.6) somos conduzidos à hamiltoniana final da teoria que, 


com Dirac, chamaremos de hamiltoniana total: 


Hr=H+ » Umm + Dunn =H'+ 3 vada , (8.8.29) 
onde 
H'=H+ x Umbm (8.8.30) 
e definimos 
do = a VOO ds (8.8.31) 


Em termos da hamiltoniana total as equações de movimento escrevem-se simplesmente 


F x {F, Hr} . (8.8.32) 


O quadro geral pode agora ser resumido. Os coeficientes v, são arbitrários, de modo 
que a solução geral das equações de movimento contém funções arbitrárias do tempo. 
As condições iniciais não determinam univocamente as variáveis dinâmicas em tempos 
futuros. Isto é típico das teorias dotadas de invariância sob transformações de calibre, que 
em geral são descritas por um número maior de variáveis do que o número de graus de 


liberdade físicos da teoria.* 


Uma classificação dos vínculos de importância fundamental, especialmente para a 
transição à teoria quântica, é a que distingue vínculos de primeira classe de vínculos de 
segunda classe. Uma função F(q, p) é dita de primeira classe se o seu paréntese de Poisson 


com qualquer um dos vínculos é fracamente zero: 


4A teoria de calibre arquetípica é a eletrodinâmica de Maxwell descrita em termos dos potenciais 
escalar e vetor. 
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{F p} S0 , j=l, J. (8.8.33) 


Dizemos que F é de segunda classe se o seu parêntese de Poisson com pelo menos um dos 
vínculos não é fracamente zero. A hamiltoniana total (8.8.29) é de primeira classe porque 
é a soma de H’ de primeira classe com com uma combinação linear com coeficientes 
arbitrários de vínculos de primeira classe ®, definidos pela Eq.(8.8.31). A teoria contém 


tantas funções arbitrárias do tempo quantos são os vínculos de primeira classe. 


E Exercício 8.8.2. Prove que H’ e d,, definidas por (8.8.30) e (8.8.31), são funções de 


primeira classe. a 


Os vínculos primários de primeira classe têm um importante significado físico, que 


passamos a discutir. Sejam dadas condições iniciais em t = 0 e consideremos 


Fu = Fy + Fot = Fy + {F, Hrjót = Fo + [UH + Y va{F, do] . (8.8.34) 


Como os v's são arbitrários, uma escolha de valores diferentes v/ para esses coeficientes 


produz uma mudança em Fö: 


AF: = dt > (vi e Va) {F, day = Str, day , (8.8.35) 


onde 


Ea = (vi, — Ua) 6t . (8.8.36) 


O mesmo estado físico é descrito por Fs ou por Fy + AFs,. Mas a Eq.(8.8.35) é uma 
soma de transformações canônicas infinitesimais, cada uma gerada por ®, com parâmetro 
infinitesimal associado €a. Logo, os vínculos primários de primeira classe geram trans- 
formações de calibre, isto é, transformações canônicas infinitesimais que mudam os q’s e 


p's mas não alteram o estado físico do sistema. 


E Exemplo 8.8.3. (Sundermeyer 1982) Aplique o algoritmo de Dirac-Bergmann à lagrangiana 
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e 1, 2 iad 
Lg 2, 42) = zË + gag + (1 — a)qıġ2 + za —q@)? . (8.8.37) 
Solução. A matriz hessiana 
1 0 
W = 8. 
( 0 0 (8.8.38) 
é singular. Os momentos canônicos são 
OL OL 
aa See (TS 8.8.39 
pı aa gi+q2 , p2 EEE (l-a)q , ( ) 
e dão lugar ao vínculo primário 
og =pet(a-l1l)gy x0. (8.8.40) 
A hamiltoniana é dada por 
1 p 
H= z1 q2) z qo)? F (8.8.41) 


A exigência de que o vínculo primário seja preservado ao longo do tempo traduz-se na condição 
de consistência 


0 = {¢1, H} + Mor, b1} = a(pı — q2) — blq — Q2) . (8.8.42) 


Situação (a): a = 8 =0. A condição de consistência é identicamente satisfeita e não há 
vínculos secundários. As hamiltoniana total é Hr = H + Ad, e as equações de Hamilton são 


d=- , p=A, WSA , do=p-—q. (8.8.43) 


Como A é arbitrário, segue-se que q2 é uma função arbitrária do tempo. Por outro lado, de 
(8.8.43) deduz-se 


qa =A-A=0 q1 = constante . (8.8.44) 


É fácil compreender o porquê desta solução geral das equações de movimento notando que 
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1. 
L= di + = (a0) - (8.8.45) 


Uma vez que lagrangianas que só diferem por uma derivada total em relação ao tempo geram as 
mesmas equações de movimento, somos levados a concluir que o sistema equivale a uma partícula 
livre com um único grau de liberdade. A variável q2 não representa nenhum grau de liberdade 
físico do sistema, é arbitrária e pode ser descartada. A existência de uma função arbitrária do 
tempo está de acordo com a teoria geral, pois quando só há um vínculo este é necessariamente 
de primeira classe. 


Situação (b): a = 0,8 0. Neste caso, de (8.8.42) deduz-se um vínculo secundário 


Q2 =q -q~ 0. (8.8.46) 


A condição de consistência aplicada a ¢2 resulta em 


{2,1} + Moo, d1)=0 = pi-@-A=0 A=p-q, (8.8.47) 


de modo que o multiplicador de Lagrange fica determinado e a hamiltoniana total torna-se 


(qı — 92)" + (pi — qo)(po — qı) . (8.8.48) 


Os vínculos ¢1 e ¢2 são de segunda classe porque {¢1, ¢2} = 1. Um cálculo elementar fornece 
a matriz dos vínculos e sua inversa: 


Hesi- (14 à = | Coto i= (3 E (8849) 


O parêntese de Dirac é dado por 


2 
{F,G} = (5,0) — > (Pd) Castós, G} = {F, G} + {F, bi} {o2, G} — {F, do HP, G} - 
a,b=1 
(8.8.50) 


Com o emprego dos parénteses de Dirac os vinculos podem ser postos iguais a zero na hamilto- 
niana, que reduz-se a 


1 
H = Hr = 5 (PI = 95)? = (8.8.51) 


As equações de movimento (8.8.20) dão 
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=- — QS- , ÙS TR , PDo=p-—q. (8.8.52a) 


Com o emprego dos parênteses de Dirac os vínculos p —qı = 0 e q2—qı = O tornam-se equações 
fortes e podem ser substituídas em (8.8.52a) para dar 


M=p-H o, P=pPi-H- (8.8.52b) 


A solução geral destas equações é 


a(t)=q(t)=po(t)=at+b—-a , pi(t) =at+b , (8.8.53) 


com a e b constantes arbitrárias. Confirma-se a análise genérica segundo a qual não restam 
funções arbitrárias do tempo quando todos os vínculos são de segunda classe. 


Se a £0, o vínculo secundário derivado de (8.8.42) tem a forma 


do = a(pi — q2) — B(q1 — G2) = 0 , (8.8.54) 


e com o uso da hamiltoniana (8.8.41) a condição de consistência associada escreve-se 


{¢2, H} + Moo, 91} = —B[(p1 — 42) — alqı - q2) + (8 - 02) Z0 . (8.8.55) 


Situação (c): a #0, 8B =a”. O vínculo secundário (8.8.54) toma a forma simplificada 


=P -Q -alq = Ga) = 0's (8.8.56) 


Usando a hamiltoniana (8.8.41) com 8 = a7, a condição de consistência aplicada a @2 não gera 
novos vínculos porque 


too, H} + Moo, d1) = —ado = 0 (8.8.57) 


é identicamente satisfeita em virtude do vínculo ¢2 = 0. As equações de movimento (8.8.32) 
fornecem 


H=P-gt(a-ljaA , q=A, (8.8.58a) 


pr=oc(qa-q)-(a-DÃ, pp=p-q-oc(gn-—g). (8.8.58b) 
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Resulta que À ( logo, q2) é função arbitrária do tempo. Isto é consistente com o fato de o 
vínculo 4 ser de primeira classe. 


Situação (d): a 0,8% a?. O multiplicador de Lagrange À é univocamente determinado 
por 


B 


pga 


[(p q2) — a(qı @)| = “(q — a) ; (8.8.59) 


onde usamos ¢2 = 0. Os vínculos ¢1,@2 são de segunda classe e as equações de movimento são 


4d =m- , Q= CI — q2) (8.8.60a) 
i l-a 
p=—-("-4@) , po= ( ) (qı — q2) (8.8.60b) 
a a 
Não aparecem funções arbitrárias do tempo. E 


E Exercício 8.8.3. Na situação (a) do Exemplo 8.8.3, que tipo de transformação canônica 
infinitesimal é gerada pelo vínculo primário de primeira classe ¢; ? Comprove que essa trans- 
formação só afeta quantidades arbitrárias, de modo que trata-se de uma transformação de calibre 
que não altera o estado físico do sistema. Na situação (d) do Exemplo 8.8.3, determine a forma 
explícita dos parênteses de Dirac em termos dos parênteses de Poisson e obtenha as equações de 


movimento (8.8.60). E 


Os exemplos discutidos acima são puramente acadêmicos, mas ilustram bastante bem 
as diversas situações encontradas nos modelos fisicamente relevantes, os quais consistem 
em teorias de campos que ainda não estamos preparados para abordar.” Outros aspectos 
importantes da teoria dos sistemas hamiltonianos vinculados, tais como o papel dos vículos 
secundários de primeira classe, a hamiltoniana estendida, a conjectura de Dirac, a fixação 
do calibre e os graus de liberdade independentes, e as regras de quantização de Dirac não 
cabem neste tratamento introdutório. Para estas e outras questões o leitor interessado 


deve consultar obras especializadas (Dirac 1964; Henneaux & Teitelboim 1992). 


5No Capítulo 10 fazemos uma breve discussão, por meio de exemplos simples, de teorias de campos 
com vínculos. 
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PROBLEMAS 


8.1. (i) Partindo da equação (8.1.9) na forma ®(q,p,t) = Fı(q, Q(q,p,t),t), prove que 
o/t = — >, P,OQ;/Ot+OF\/Ot. (ii) Usando d®(q, p, t) = d®(q, p, t)lt fixo + (OP/Ot) dt e 
uma equação análoga para dQ;(q, p, t), mostre, com o emprego de (8.1.11), que se (8.2.1) 


vale então (8.1.8) é satisfeita para t variável. 


8.2. Para que valores de a e 8 a transformação 


Q=q°cosBq , P=qêsenfq 


é canônica? 


8.3. Um certo sistema mecânico tem hamiltoniana 


H = 5[(p— ag)? + ula +00?) 


com w,a e b constantes. (a) Prove que a transformação Q =q +bt, P=p—aq+bé 
canônica e determine uma função geradora. (b) Mostre que a hamiltoniana transformada 
é K = (P? + w?Q?)/2. (c) Usando a solução bem conhecida das equações de movimento 


nas novas variáveis, retorne às variáveis originais para obter q(t). (d) Prove que 


1 
R(q,p,t) = 5(p — ag + b)’ 4 


é constante de movimento. 


8.4. Uma partícula em movimento unidimensional sujeita a uma força constante F 


possui hamiltoniana 


2 
PP hacia 
2m 


(a) Encontre uma transformação canônica tal que a hamiltoniana transformada seja dada 
por K(Q,P) =P. (b) Resolva as equações da Hamilton para as novas variáveis canônicas 


e retorne às variáveis originais para obter q(t). 
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8.5. Um sistema físico com um grau de liberdade tem hamiltoniana 


onde y é uma constante. Escreva as equações de Hamilton e deduza uma equação dife- 
rencial de segunda ordem para x(t). Dadas as condições iniciais x(0) = 0 e (0) = vo, 


resolva a equação de movimento para u = e?” usando a fórmula (8.5.24) e daí determine 


z(t). 


8.6. A hamiltoniana de um sistema com um grau de liberdade tem a forma 


1 1 
HA lp ES] 
(erti) 


Escreva as equações de Hamilton e delas deduza uma equação diferencial de segunda 
ordem envolvendo apenas q. (b) Invente uma transformação canônica que reduza H à 
hamiltoniana de um oscilador harmônico: K = (P? + Q?)/2. (c) Sabendo que a solução 
geral do problema do oscilador é Q(t) = Acos(wt + ô) , determine P(t). (d) Retornando 
‘as variáveis originais, encontre q(t). Esta função é, portanto, a solução da equação 


diferencial complicada obtida no item (a). 


8.7. Um sistema com um grau de liberdade é descrito pela hamiltoniana 


Ea 
“Po kf(q) , 


onde k é uma constante, f e g sendo funções dadas. Encontre uma transformação 
canônica que reduza esta hamiltoniana à de uma partícula de massa unitária sujeita a 
uma força constante. Resolva as equações de Hamilton transformadas e mostre que o 
movimento do sistema em termos da variável original q é q(t) = f!(a+bt+kt?/2), onde 


a e b são constantes arbitrárias e f~! é a função inversa de f. 


8.8. De acordo com o Teorema 2.3.1, as equações de Lagrange não se alteram pela 
substituição da lagrangiana L(q,q,t) por L(q,q,t) = L(a,q,t) + df(q,t)/dt, onde f(q,t) 
é uma função arbitrária. Prove que esta transformação é canônica e encontre uma função 


geradora. 


8.9. Considere a hamiltoniana 
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H- P (aka) 
2m 2m 


(a) Determine as constantes A e B de modo que a transformação 


Q= Ap , P=-p—kgo , Q2 = B(pı — kq2) , Ph =p 


seja canônica. (b) Mediante a transformação canônica do item anterior e resolvendo as 
equações de movimento para as variáveis transformadas, encontre a solução das equações 
de movimento para q(t) e q(t). 

8.10. A hamiltoniana de um certo sistema unidimensional é H = w?p(q + t)}?, onde w 
é uma constante positiva. (a) Prove que a transformação Q =q +t, P = p é canônica 
e encontre uma função geradora. (b) Usando a transformação canônica do item anterior, 
resolva as equações de Hamilton para q(t) e p(t). 

8.11. Uma partícula de massa m move-se ao longo de uma linha reta sob o potencial 
V = mk/x?. Dadas as condições iniciais x(0) = xo e &(0) = 0, obtenha x(t) por meio 


da solução em série envolvendo parênteses de Poisson sucessivos para u = 2°. 


8.12. Mostre que a transformação 


Q=In(l+vgcosp) , P = 2(1 + y/q cos p) y/q sen p 


é canônica e que uma função geradora é F3(p,Q) = — (e? — 1)? tanp. 


8.13. Tomando a Eq.(8.6.6) como ponto de partida, prove que 


{F,L} =-1 xF=-Fx1 


Ss 
onde 1 é o tensor unidade. 


8.14. A hamiltoniana de um certo sistema é H = q+te”. (i) Mostre que a transformação 
Q =q+te , P = p é canônica. (ii) Encontre uma função geradora. (iii) Determine a 
hamiltoniana transformada K(Q, P,t). 
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8.15. Um oscilador harmônico bidimensional isotrópico tem hamiltoniana 


l,a 2 mw? 2 2 
H = sm Pe t Py) 4 (£f +y"). 


Sabendo que A = p? + m?w?x? e L = xpy — yp, são constantes de movimento, use o 
teorema de Poisson para provar que B = papy + Mw?’ zy e C = p} — p} + mw? (x? — y?) 


também são constantes de movimento. 


8.16. Um sistema com dois graus de liberdade é descrito pela hamiltoniana 


1 1 
Montr Eos q)? + aa Q), 


Mostre que a transformação 


qı = y Qı cos Pi + y2Q2 cos P> , q = —4/ Qı cos Pi + \/2Q2 cos Po , 
pı = y Qı sen Pi + /Qo/2senP  , p =—yQisen P) + \/Q2/2sen P» 


é canônica e obtenha a hamiltoniana transformada em termos das novas variáveis canônicas. 


Use os resultados para encontrar q1, q2, p1, P2 como funções do tempo. 


8.17. Considere a lagrangiana 


L=(y—z)(@—-y) . 


(i) Se e(t) é uma função infinitesimal arbitrária, que efeito a transformação infinitesimal 


produz na lagrangiana? E nas equações de movimento? (ii) Encontre os vínculos primários. 
(iii) Obtenha a hamiltoniana canônica e a hamiltoniana total. (iv) Aplique o algoritmo de 


Dirac-Bergmann e determine todos os vínculos da teoria. (iv) Prove que todos os vínculos 
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são de primeira classe. (v) Mostre que as equações hamiltoniana de movimento coincidem 


com as equações de Lagrange originais. 


8.18. Um modelo mecânico simples, que tem propriedades de invariância de calibre 
análogas às da eletrodinâmica quântica e da cromodinâmica quântica, é descrito pela 
lagrangiana (Christ & Lee 1980; Lee 1981) 


L= +P- EVO), 


onde (r,@) são coordenadas polares no plano e é um grau de liberdade adicional. (i) 


Prove que a lagrangiana é invariante sob a transformação de calibre finita 


do OPO): q E E ral), 


onde a(t) é uma fun cão arbitrária. (ii) Encontre os vínculos primários. (iii) Obtenha a 
hamiltoniana canônica e a hamiltoniana total. (iv) Aplique o algoritmo de Dirac-Bergmann 
e determine todos os vínculos do modelo. (iv) Prove que todos os vínculos são de primeira 
classe. (v) Mostre que as equações hamiltonianas de movimento coincidem com as equações 
de Lagrange originais. (vi) Verifique que a lagrangiana acima descreve uma partícula 
movendo-se num plano mas observada de um referencial que gira com velocidade angular 


é, sendo € tratada como uma variável dinâmica. 


Capitulo 9 


TEORIA DE HAMILTON-JACOBI 


It is impossible to explain honestly the beauties of the laws of nature without some 
deep understanding of mathematics. 


Richard Feynman 


No capítulo anterior vários exemplos foram considerados em que as equações de Hamil- 
ton para sistemas mecânicos simples puderam ser resolvidas com a ajuda de transformações 
canônicas. Tais transformações, todavia, foram obtidas por inspeção, não sendo produto de 
nenhum procedimento genérico e sistemático. A teoria de Hamilton-Jacobi é um método 
construtivo que permite, em princípio, encontrar uma transformação canônica capaz de 
simplificar drasticamente as equações de movimento de um sistema descrito por uma 
função hamiltoniana arbitrária. Como consequência, a integração das equações de movi- 
mento transformadas torna-se trivial, reduzindo a resolução das equações de Hamilton a 


um processo simplesmente algébrico. 


9.1 A Equação de Hamilton-Jacobi 


Dado um sistema mecânico descrito pelas variáveis canônicas (q,p) e pela hamiltoni- 
ana H(q,p,t), efetuemos uma transformação canônica por meio de uma função geradora 
S(q, P,t). Suponhamos que S possa ser escolhida de tal modo que a hamiltoniana trans- 
formada seja nula, isto é, K(Q, Pt) = 0. Nessas circunstâncias as equações de Hamilton 


transformadas são trivialmente solúveis: 


Q=55=0 => Q=B, (9.1.1a) 
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. OK 
P, =-= =0 = P=4a,, 9.1.1b 
DO, a ( ) 
onde a's e 5's são constantes. 
De acordo com (8.1.16) temos 
os 
0=K =H(g,pt)+ a f (9.1.2) 


donde, usando as equações de transformação 


OS 
i= i 9.1.3 
Pi= 3 (9.1.3) 
decorrentes da Eq.(8.1.15), deduzimos a equação de Hamilton-Jacobi 
Os OS os 
H Ape aÃ ,t) 4 = 0°. 1.4 


Esta é uma equação diferencial parcial de primeira ordem nas n+1 variáveis independentes 
Gi;--+>Qn,t. Felizmente, não necessitamos de sua solução geral, que é muito difícil de ser 
obtida por tratar-se de uma equação não-linear, e que envolve uma função arbitrária. 
Como veremos por intermédio de numerosos exemplos, a equação de Hamilton-Jacobi 
admite soluções particulares contendo n + 1 constantes arbitrárias a1,...,Q@n4,. Uma 
vez que S não está envolvida diretamente na equação, mas apenas suas derivadas, uma das 
constantes — digamos, @n+1 — é meramente aditiva. Em outras palavras, qualquer solução 
contendo n+ 1 parâmetros é da forma S + an+1. A constante aditiva a,4,1 pode ser 
descartada, pois não modifica a transformação gerada por S. A discussão no parágrafo 
anterior sugere que, encontrada uma solução da equação de Hamilton-Jacobi da forma 
S(qi,--+;Qn; Q1,--+,Q@n,t) onde os a’s são constantes de integração não-aditivas, fazendo 
a identificação a; = P; a função S(q, P,t) assim construída executa uma transformação 
canônica que reduz a zero a nova hamiltoniana. Com essa identificação, o movimento do 


sistema em termos das variáveis canônicas originais é determinado pelas equações 


i=1,...,n, (9.1.5) 
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que resultam da combinação de (8.1.15) com (9.1.1a). As n equações (9.1.5) podem ser 


resolvidas para os q's fornecendo 


q = qa, Bt). (9.1.6) 


Conjuntamente com a Eq.(9.1.3), este resultado permite escrever 


pi = pila, B,t) . (9.1.7) 


Estas duas últimas equações representam a solução geral das equações de Hamilton origi- 
nais envolvendo 2n constantes de integraçãocujos valores são determinados pelas condições 


iniciais. 


Em face do caráter heurístico da discussão acima, vale a pena torná-la mais rigorosa 


por meio de definições precisas e demonstrações dos resultados sugeridos anteriormente. 


Definição 9.1.1. Uma solução completa ou integral completa da equação de Hamilton- 


Jacobi é uma solução da forma S(g1,...,Qn,01,...,Qn;t) contendo n constantes não 
aditivas a1,...,Q@, e tal que 
det ( a Ave (9.1.8) 
Oqida; 
A condição (9.1.8) caracteriza os parâmetros Q1,...,@n como mutuamente indepen- 


dentes e, ao mesmo tempo, garante que as Eqs.(9.1.5) podem ser resolvidas para os q's na 
forma (9.1.6). Podemos, agora, sintetizar o resultado central da teoria de Hamilton-Jacobi 


na proposição que se segue. 


Teorema de Jacobi. Seja S(g,a,t) uma integral completa da equação de Hamilton- 
Jacobi. Então os q’s e p's determinados pelas Eqs.(9.1.5) e (9.1.3) obedecem às equações 


de Hamilton aH aH 
k = — gee He ater Ris 9.1.9 
q Op; á oqi ' j l ) 


Demonstração. Diferenciando (9.1.5) relativamente ao tempo resulta 
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| os as 
sa O dida; ` 


j 


(9.1.10) 


Por outro lado, lançando mão da Eq.(9.1.3), podemos escrever a equação de Hamilton- 
Jacobi (9.1.4) na forma 


os 
H(q,p(q,,t),t) + a =. (9.1.11) 
Diferenciando esta equação em relação a a; obtemos 
ðH 028 Os. 
0, (9.1.12) 


2 Bp Des Benet 


onde empregamos novamente a Eq.(9.1.3). Levando em conta que a ordem de diferenciação 


é irrelevante, e substituindo (9.1.12) em (9.1.10), ficamos com 


os OH 

— (q;-—)=0. 9.1.13 
> Oq;dai (a; TA ( ) 
Como a matriz cujos elemento sao 07S/0q;0a; é não-singular pela Eq.(9.1.8), o sistema 


homogêneo de equações lineares (9.1.13) possui somente a solução trivial 


oH 
n —— = 0 e os . 9.1.14 
qj Op; » J ; EM) ( ) 


Tomando a derivada total em relação ao tempo de (9.1.3) vem 


Ss 0088 
p= a Dada “Dom (9.1.15) 


Mas de (9.1.11) deduz-se, diferenciando relativamente a qi, 


OE a 07S | OS 
On: Op; Oq:0q; © OqOt 


j 


0. (9.1.16) 


A substituição deste último resultado em (9.1.15) conduz a 
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OH OS (a 9H ) OH 
j 


y= f SR) = 9.1.17 
i Ogi > 04:04; Op; qi l ) 


em virtude de (9.1.14), completando a demonstração do teorema. 


9.2 Exemplos Unidimensionais 


A discussão de alguns exemplos simples servirá para ilustrar o emprego da técnica, 


além de motivar certas observações de caráter geral que serão feitas mais adiante. 
E Exemplo 9.2.1. Resolver a equação de movimento de uma partícula livre unidimensional 
pelo método de Hamilton-Jacobi. 


Solução. Visto que H = p*/2m, a equação de Hamilton-Jacobi assume a forma 


0. (9.2.1) 


1/0842 as 
(aq) ba 


2m 


Uma integral completa desta equação pode ser obtida por separação de variáveis na forma de 
soma: 


S=W(0)+T(t). (9.2.2) 


Introduzindo S desta forma em (9.2.1) resulta 


(9.2.3) 


1 /dW\2 dT 
m dq ) = d’ 
Se fixarmos t e variarmos q o lado esquerdo de (9.2.3) deveria variar. No entanto, ele não pode 
variar porque o lado direito permanece fixo. Logo, ambos os lados de (9.2.3) são iguais a uma 
mesma constante positiva que, por conveniência, denotaremos por a? /2m. Ficamos, assim, com 
as duas equações diferenciais ordinárias 


dW dT a? 
E T 9.2.4 
da Co CRM (A 


donde 


S(q,a,t) = ag — sat i (9.2.5) 
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tendo sido abandonadas constantes de integração meramente aditivas. A solução da equação de 
movimento para q obtém-se de 


a 
eee 9.2.6 
B da m b) ( ) 
isto é, 
g=8+ 2t= q + Pt (9.2.7) 
m m 
ja que 
os 
p= — = a = constante = po . (9.2.8) 
ôq 
A Eq.(9.2.7) é a conhecida solução do problema da partícula livre. E 


E Exemplo 9.2.2. Resolver a equação de movimento de um oscilador harmônico unidimen- 
sional pelo método de Hamilton-Jacobi. 


Solução. Agora H = p?/2m + mw?q?/2, e a equação de Hamilton-Jacobi escreve-se 


1 Ei mw? > OS 


S0 AD: 
dg 5 ee 0 (9.2.9) 


2m 


Assim como no caso da partícula livre, a equação (9.2.9) é separável na forma 


S=W(g) —at, (9.2.10) 


onde W satisfaz 


1 /dW\2 mw”, 
H =Q. .2.11 
ak dq ) A 4 a 


A constante positiva a coincide com o valor constante da hamiltoniana (igual à energia total, 
neste caso), pois dW/dq = 05/0q = p. A solução de (9.2.11) é imediata: 


W = / V2ma — mw? dq . (9.2.12) 


Em conseqiiéncia, 
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S(q,a,t) = / V2ma — mw2g? dg — at , (9.2.13) 


e a solução da equação de movimento para q obtém-se de 


os dq LA 
SRS a t= ee Mt 2.14 
o da m f a= DR „een ( Da a) (9 ) 


Resolvendo esta equação para q encontra-se, com 6 =w, 


q(t) =4/ =, sen(wt + ô) , (9.2.15) 


que é a bem conhecida solução do problema do oscilador. E 


Nosso último exemplo unidimensional revela que o método de Hamilton-Jacobi pode 


ser estendido a certas classes de sistemas não-conservativos. 


E Exemplo 9.2.3. (Lemos 1979) Use a teoria de Hamilton-Jacobi para resolver a equação de 
movimento 


g@+rAg+w*q=0, (9.2.16) 


que descreve um oscilador harmônico amortecido. 


Solução. A Eq.(9.2.16) é gerada pela lagrangiana (vide Problema 1.14) 


L= (rË TR), (9.2.17) 


cuja hamiltoniana correspondente é 


pee ção por. (9.2.18) 
A equação de Hamilton-Jacobi associada a esta hamiltoniana é 


OS\2 mw? os 
( Ja BNE 4, 


ag) oe ee 


—At 
E Eis (9.2.19) 


2m 


Devido à dependência temporal explícita de H , esta última equação não admite separação da 
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varidvel temporal na forma dos exemplos anteriores (verifique!). No entanto, a forma de H 
sugere que a transformação 


Qege 3. Pepe ve (9.2.20) 


provavelmente simplificará a hamiltoniana. Acontece que esta transformação é canônica com 


função geradora F(q, P,t) = eòt/2qP , e a hamiltoniana transformada 


K(Q,P,t) = H(q,p,t) 4 OP a. + Q? 4 XP (9.2.21) 


não depende explicitamente do tempo. A equação de Hamilton-Jacobi associada a K escreve-se 


1 7OS\2.. mw? a à ôS ôS 
m) O Oo a (9.2.22) 
a qual possui solução da forma 
S=W(Q)-at , (9.2.23) 
onde 
1 ;dW\2) mw? a A dW 
ee ay, todo e (9.2.24) 


Note que a é igual ao valor constante da Hamiltoniana K . Resolvendo esta equação algébrica 
do segundo grau para dW/dQ obtém-se 


—— =-er+[b?-(1- a?) x? J]? : (9.2.25) 


com x = (mw)/?2Q, a= /2w, b = (2a/w)!/*. No tocante à resolução de (9.2.16) a escolha do 
sinal em (9.2.25) é irrelevante (ver Exercicio 9.2.1), de modo que tomaremos 


ax? 


W=- + /[P-(- x de . (9.2.26) 


Cosideremos o caso a < 1, isto é, À < 2w. Definindo y = (1—a?)!/? resulta 


2 2 1/2 
E a K Es Px") ; dz , (9.2.27) 


donde 
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Os 1 dx 1 (JL 
E La = nee 2.2 
B da Cas / (b2 — 2a2)1/2 ee wy SEn ( ) (9.2.28) 


Resolvendo para x e retornando à variável q resulta, finalmente, 
q(t) = Ae~#/? sen(Qt + ô) : Q= (w? — aye? ; (9.2.29) 


onde A e 6 são constantes determinadas pelas condições iniciais. A Eq.(9.2.29) é a solução usual 


para o oscilador amortecido no caso de amortecimento fraco. E 


E Exercício 9.2.1. (i) Confirme que a escolha do sinal negativo em (9.2.25) não afeta a forma 
da solução (9.2.29). (ii) Complete o Exemplo 9.2.3 tratando os casos À = 2w (amortecimento 


crítico) e A > 2w (amortecimento forte). E 


9.3 Separação de Variáveis 


Um aspecto simplificador do método de Hamilton-Jacobi é a desnecessidade de se 
obter a solução geral da equação de Hamilton-Jacobi para resolver o problema dinâmico, 
bastando encontrar uma integral completa, que é somente uma solução particular. Soluções 
particulares de equações diferenciais parciais podem ser comumente obtidas por separação 
de variáveis. A natureza da equação de Hamilton-Jacobi torna possível, em grande número 
de casos, a separação de variáveis em forma de soma. Algumas observações de caráter geral, 
embora extremamente simples, facilitam consideravelmente a tarefa de separar variáveis 


em boa parte das situações relevantes. 


1. Variáveis cíclicas. Se uma certa coordenada, digamos qn, é variável cíclica de 
H , é possível separá-la imediatamente das demais. De fato, suponha que H não dependa 


de qn. Então podemos escrever 


S = Ondn + S(n,...,Gn-1t) (9.3.1) 


onde, substituindo em (9.1.4), S satisfaz 
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os os os 
AN Gin YOR bored: , Qn, —=0, 9.3.2 
(a Qn-1 Jq Odn-a ) at ( ) 
que só envolve as variáveis q1,...,Qn-1,t. A motivação para buscar uma solução para a 
equação de Hamilton-Jacobi da forma (9.3.1) provém de 
Os 
== PME Qn , 9.3.3 
e e (9.3.3) 


pois pn é constante de movimento sempre que qn é variável cíclica. A solução desta 
última equação diferencial para S é precisamente da forma (9.3.1). Uma justificativa 
adicional é que estamos em busca de uma transformação canônica que torne todos os P’s 
constantes de movimento. Mas pn já é constante de movimento, de modo que, no que 
concerne ao par (qn, Pn) , basta executar a transformação identidade, cuja função geradora 
é Fy = (mPa = nan em virtude da identificação a; = P,. Se houver mais variáveis 
cíclicas, é evidente que o primeiro termo à direita do sinal de igualdade em (9.3.1) torna- 
se uma soma sobre todas as variáveis cíclicas, ao passo que S envolve somente as variáveis 


que não são cíclicas. Por exemplo, se q, € Gn—1 são cíclicas temos 


S = Ann + An—19n-1 + S(a, «cs Qn-2 t) (9.3.4) 
onde 2 a x 
OS OS OS 
H MR pO aad Cias Ging t — = 0. .3. 
EE Da Da HA js (9.3.5) 


2. Variável temporal. Como os exemplos da Seção 9.2 indicam, se H não depende 


explicitamente do tempo a equação de Hamilton-Jacobi 


os as as _ E 


FE iis ape ade a 


admite separação da variável t na forma 


S=W(q,---,dn) — at, (9.3.7) 
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onde W — chamada de função característica de Hamilton — satisfaz 


(9.3.8) 


Esta equação para W não contém o tempo e a; é igual ao valor constante da hamiltoni- 
ana. Uma solução completa S(q,a,t) de (9.3.6) fica determinada uma vez que se encontre 
uma integral completa W(g,a) da equação de Hamilton-Jacobi independente do tempo 
(9.3.8). A função W (q,a), por si só, já produz uma transformação canônica que resolve 


completamente as equações de movimento para os q's. 


E Exercício 9.3.1. Suponha que H não dependa explicitamente do tempo e seja W (q,a) 
uma integral completa de (9.3.8). Encarando W como função geradora de uma transformação 
canônica com a; = P;, mostre que as equações de Hamilton transformadas são 


P=0 = P=a,i=l.sn, 
Ot. =>. Quid (9.3.9) 


Qi =0 =>? Qu=bDi ps VS dea 
Em outras palavras, conclua que por meio das equações 


OW Ow 


SS = t = 
Oa, © pı i da; 


Ge BSD As (9.3.10) 


são determinados os q(a, 3,t) que obedecem às equações de Hamilton e contêm 2n constantes 


de integração cujos valores são fixados pelas condições iniciais. E 


A separabilidade da equação de Hamilton-Jacobi depende do problema físico e do 
conjunto de coordenadas generalizadas escolhido. Os chamados sistemas integráveis são 
aqueles para os quais a equação de Hamilton-Jacobi é separável em algum sistema de 
coordenadas e as equações de movimento são resolvidas por quadraturas. O problema de 
três corpos sob mútua atração gravitacional constitui um dos exemplos mais famosos de 
sistema não-integrável. Mesmo no caso de sistemas integráveis, não se conhece nenhum 
critério completamente geral que indique os sistemas de coordenadas nos quais a equação 


de Hamilton-Jacobi é separável. Para sistemas de coordenadas generalizadas ortogonais, 
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um teorema devido a Stackel estabelece as condições necessárias e suficientes para a se- 
parabilidade (Pars 1965). Aqui, no entanto, vamos cingir-nos a tratar alguns exemplos 
de interesse físico que ilustram as técnicas de separação de variáveis costumeiramente 


empregadas. 


E Exemplo 9.3.1. Encontrar uma integral completa da equação de Hamilton-Jacobi para 
uma partícula no potencial V(r,0) = a(r) + b(0)/r2 onde (r,0,4) são coordenadas esféricas, 
com a(r) e b(0) funções conhecidas. 


Solução. A hamiltoniana deste problema é dada por [vide Eq.(7.1.15)] 


1 (2, Ds ia b(0) 
am 2m (p? + y2 + p2 a a(r) + ae (9.3.11) 
de modo que a equacao de Hamilton-Jacobi toma a forma 
1 OS\2 1 /OS\2 1 OS\2 b(0) aS 
2m G i 5 (59) + TIE + a(r) + 2 ar Ot 0. (9.3.12) 


Visto que H não depende explicitamente do tempo e y é coordenada cíclica, podemos escrever 


S = -ait + ayp +W (r,0) , (9.3.13) 
onde 5 
1 |;OW\2 1,0W,2 Ci b(0) 
+ = : 3.14 
2m ( Or =a 00 ) r2 sen26 PAIF r2 “a faso red) 
Tentando uma solução para esta equação da forma 
W(r,0) = Wi(r) + W2(8) (9.3.15) 
somos conduzidos a 
1 [;dWi\2 1 ;dW2\2 a2 b(0) 
H — = 3 3.1 
2m ( dr ) 3( de ) r2 sendo a(r) + 2 01 (9.3.16) 


Multiplicando esta equação por r° ficamos com 


2 


(SA) tato) -a = (Se) a nol =-$8 , (9.3.17) 


2m\ dr 2n\ dé 2m sen?6 
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de modo que as variáveis r e 0 foram separadas, a constante de separação tendo sido con- 
venientemente denotada por —ag/2m. A Eq.(9.3.17) equivale às duas equações diferenciais 
ordinárias 


dW Q 
rF emos — a(r)] — a f (9.3.18) 
dW2 los ag 


Integrando estas equações e inserindo os resultados em (9.2.15) e (9.2.13) resulta uma integral 
completa de (9.2.12) na forma 


a 1/2 a2 JH? 
S=-ajt+ayy +f 2m[ay — a(r)| — E] dr +f az — 2mb(0) — = do , (9.3.20) 
A solução das equações de movimento é dada por 

EE eae i ! (9.3.21) 

Ja 1/2 

; [2mļo — a(r)| — 03 /r?] 

os agdr ado 

Bo = 5 = / et) - — m > 032) 
r [2mļo — a(r)] — aĝ/r | ja? — 2mb(0) — a2 / sen J 
Os ado 

de= =" i 2 a (9.3.23) 

? sen?6|a3 — 2mb(0) — a3 / sen?6] 


E impossivel nao notar a presteza e simplicidade impressionantes com que se reduz a quadraturas 
a solução deste problema pelo método de Hamilton-Jacobi. A Eq.(9.3.21) fornece r(t) que, após 
substituição em (9.3.22), determina 6(t). Tendo encontrado 6(t), mediante (9.3.23) obtém-se 
p(t), completando a resolução das equações de movimento. Caso se esteja interessado apenas 
na trajetória geométrica descrita pela partícula, basta utilizar as duas últimas equações para 


exprimir a equação da curva na forma r = r(0), p = (0) ou 0 = A(y),r=r(y). E 


Embora os potenciais centrais sejam os mais importantes para as aplicações físicas, o 
potencial V(r,0) = A/r + B/r?sen?0, A e B constantes, foi proposto (Hartmann 1972) 


para descrever o movimento de um elétron em moléculas na forma de um anel, tais como 
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a molécula de benzeno. O potencial de Hartmann é exatamente da forma suposta no 


exemplo que acabamos de considerar. 


E Exemplo 9.3.2. Resolva as equações de movimento de um projétil em três dimensões pelo 


método de Hamilton-Jacobi. 


Solução. Com o eixo z orientado verticalmente para cima, 


1 
H = z (Pa +p + pz) + mgz 


e a equação de Hamilton-Jacobi tem a forma 


aa | GE) + GE) + EY 


Como x e y são variáveis cíclicas e H não depende explicitamente do tempo, 


S=-ayt+agt+ayy+W(z) , 
donde 
dW \2 
(5) = 2m(ai — mgz) — ay, — a 


Integrando esta equação resulta 


2 
S = —ayt + Qrt + ayy — a 


O movimento da particula obtém-se por meio de 


Bi = da; = —t Ho [2m(a1 — mgz) — a? — a? 
Os a 

Bo = da, = v + ão [2m(ar — mgz) -o2-a 
Os a 

By = da; =y4 aa [2m(a1 —mgz) — a? — a, 


A resolução destas três últimas equações para x,y,z fornece 


+m raso ima 
OR DE o 


ae [2m(a1 —mgz)-ag—a 


Yy 


2 
y 


(9.3.24) 


(9.3.25) 


(9.3.26) 


(9.3.27) 


(9.3.28) 


9.4. A ACAO COMO FUNCAO DAS COORDENADAS 345 


c= A+ Ot, (9.3.30a) 
m 
Qy 
y=B+ t, (9.3.30b) 
m 
t2 
2=C +Dte — (9.3.30€) 


onde A,B,C,D exprimem-se em termos dos a's e 5's. As equações (9.3.30) coincidem com a 


solução usual deste problema que se obtém por métodos elementares. E 


9.4 A Ação Como Função das Coordenadas 


Conforme observamos na Seção 8.5, a ação desempenha o papel de função geradora de 
uma transformação canônica que leva o estado do sistema no tempo t ao estado num 
instante anterior fixo to. Ora, isso significa que as variáveis canônicas transformadas são 
constantes iguais aos valores dos q'se p's no instante to. Assim, vê-se que a ação executa 
uma transformação canônica com as mesmas propriedades que a realizada por uma integral 
completa S da equação de Hamilton-Jacobi. É de se esperar, portanto, que a ação e S 
difiram no máximo por uma constante — isto explica o uso da mesma notação S para 


ambas as quantidades. Tomando a derivada total em relação ao tempo de S(q,a,t) vem 


dS Os Os 
— i+ = ines H S 9.4.1 
dt D da OF 2 Pid oie 


onde usamos (9.1.3) e (9.1.4). Portanto, 


Ce if Ldt , (9.4.2) 


demonstrando que, vista como função do tempo, S e a ação somente diferem por uma 
constante. Infelizmente, a Eq.(9.4.2) é absolutamente inútil para determinar S(g,a,t) 
porque para calcular a integral que nela aparece é preciso conhecer a solução q;(t) das 
equações de movimento, mas é exatamente com esta finalidade que se busca S. Deve-se 


a Hamilton a descoberta original de que a ação, encarada como função das coordenadas, 
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satisfaz a Eq.(9.1.4), que por isso também é conhecida como equação diferencial parcial 


de Hamilton. 


A função principal de Hamilton, denominação que se costuma reservar para a ação 
expressa em termos das coordenadas, constrói-se de acordo com o seguinte procedimento. 
Seja q(T) um segmento de trajetória física conectando uma dada configuração inicial 
go = (Go1,---;9on) em T = 0 à configuração q=ú(gÂ,...,Gh) no instante T =t. A ação 


correspondente pode ser expressa em termos de q e t, tendo qo como parâmetro fixo: 


S(q, qo, t) = f L(a), EE a) dr . (9.4.3) 


Teorema 9.4.1. A função pricipal de Hamilton S(q, qo, t) obedece à equação (9.1.4). 


Demonstração. Vejamos, inicialmente, como S(q,qo,t) varia com q para t fixo. Se 
a configuração final no instante t for alterada de q para q + dq, a trajetória física será 
variada, tornando-se q(T), como indicado na Fig. 9.4.1. Conseqiientemente, conforme a 
Eq.(2.3.7), 


T= 


OL 


t oL d aL 
ôS = Í dr DE: — = (32) pato) + 2 aq” À = Au Piddi , (9.4.4) 


y 


uma vez que 6q;(7 = 0) = 0 e a trajetória física satisfaz as equações de Lagrange.! Da 
Eq. (9.4.4) deduz-se 


os 
Di = sn 


(9.4.5) 


Estudemos, agora, como varia S como função de t. Por um lado, de (9.4.3) é claro que 


ds, 


a (9.4.6) 


Por outro lado, 


1Na Eq.(9.4.4) q; designa dq;(r)/dr. 
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Figura 9.4.1: Variação envolvida na demonstração do Teorema 9.4.1. 


dS Os Os Os 
=5 q ==> Es A, 
dt Td oq! OE PE oH a) 
donde 


Combinando esta equação com (9.4.5) conclui-se que S é solução da Eq.(9.1.4). 


E Exemplo 9.4.1. Encontre a função principal de Hamilton para uma partícula sujeita a uma 
força constante F. 


Solução. O movimento físico com x(0) = zo é 


2 
T Eoi 9.4.9 
u(T) = To + vo RE (9.4.9) 


Impondo a condição x(t) = x obtém-se 


£ — Lo F 
= — ot 9.4.10 
RO t 2m ’ ( ) 
donde 
F 
a(t) = zo + (£ — 20)~ + — (T-t) . (9.4.11) 
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Portanto, 


t 2 a 2 243 
S(w,0,1) = [ ae So) RSA | E e N E, (9.4.12) 
0 2 Adr 


Fica ao encargo do leitor verificar que a equação de Hamilton-Jacobi 


1/0842 Os 
—|(—) — F — = 0 41 
2m ( Ox =e ot (sda) 
é satisfeita pela função principal de Hamilton (9.4.12). E 


Naturalmente, fazendo a identificação qo; = P;, a função principal de Hamilton gera 
uma transformação canônica que reduz as variáveis canônicas transformadas a constantes 
de movimento. Assim, a determinação de S(q,qo,t) equivale à resolução completa das 


equações da Hamilton para as variáveis canônicas originais. 


EH Exercício 9.4.1. Mostre que a equação 


os 
=. 9.4.13 

T ( ) 
com 5 constante e S dada pela Eq.(9.4.12), fornece a solução geral para o movimento de uma 


partícula sujeita a uma força constante. E 


Historicamente, coube a Hamilton perceber que, uma vez expressa em termos dos 
pontos inicial e final de uma trajetória física, a ação satisfaz a equação (9.1.4). No 
entanto, no tocante apenas à resolução das equações de movimento, a linha seguida por 
Hamilton é um círculo vicioso, pois a determinação da função principal de Hamilton requer 
o conhecimento prévio da solução das equações de movimento. O mérito pelo rompimento 
desse círculo vicioso pertence a Jacobi, que foi o primeiro a compreender que qualquer 
integral completa da Eq.(9.1.4) dá a solução do problema dinâmico. Isto não significa, 
contudo, que as idéias de Hamilton tenham sido infrutíferas. A analogia entre óptica e 
mecânica por ele desenvolvida revelou-se de extrema importância para a formulação da 
mecânica ondulatória por Schrödinger. Nessa analogia a função S(q,qo,t) desempenha 
um papel crucial, bem como na formulação de Feynman da mecânica quântica, na qual as 
quantidades físicas são expressas por meio das chamadas integrais de trajetória (Feynman 
& Hibbs 1965). 
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Vale sublinhar que a construção de uma função unívoca S(q,qo,t) só é possível se 
existir somente uma trajetória dinâmica passando por qo e q. Mas isto só pode ser 
garantido em geral para |t — to| suficientemente pequeno, porque neste caso as órbitas 
físicas emanando de qo em t = to não se cruzam. É por isso que a existência de integrais 
completas da equação de Hamilton-Jacobi só é assegurada localmente. O problema da 


existência global de uma integral completa é muito mais delicado. 


9.5 Variáveis de Ação e Ângulo 


Sistemas periódicos são de grande importância em praticamente todos os ramos da 
física. Há um método poderoso de obter as freqüências de tais sistemas que se baseia na 
teoria de Hamilton-Jacobi e que não requer a solução detalhada das equações de movi- 
mento. Tal método consiste na introdução de certas variáveis de ação, a serem definidas 
mais adiante. Antes, porém, é necessário especificar a classe de problemas tratáveis pelo 


método. 


Definição 9.5.1. Um sistema cuja hamiltoniana não depende explicitamente do tempo 
é dito separável se, para algum conjunto de coordenadas generalizadas (g1,...,Gn), existe 
uma integral completa da equação de Hamilton-Jacobi independente do tempo (9.3.8) da 


forma 


W(qi,.--, qn, Q1,- -, Qn) = Wi(q, 04,---,Qn) ++ Waldn, 01... ., On) - (9.5.1) 


No caso de um sistema separável, temos 


OS OW; 
i Adi, ERRA aa) A 9.2 
p Ba; Da; Fils, 01 Qn) (9.5.2) 


Esta última equação é a projeção no plano (q;,p;) do movimento que o sistema realiza no 


espaço de fase. 


Definição 9.5.2. Um sistema separável é dito multiperiódico se a projeção do movi- 
mento sobre cada plano (q,p;) enquadra-se numa das duas seguintes categorias: (i) a 
curva p; = pi(q,a) é fechada, isto é, q; oscila entre dois limites definidos q; = a; e 
q = bi (Fig. 9.5.1): (ii) p; é uma função periódica de q;, embora q; não seja função 


periódica do tempo (Fig. 9.5.1b). 
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Figura 9.5.1: 


O caso (i) costuma ser chamada de libração, um termo tomado de empréstimo da 
astronomia. Um exemplo óbvio é o oscilador harmônico unidimensional. O caso (ii) é 
usualmente referido como rotação, pois ocorre tipicamente quando q; é uma coordenada 
cíclica. Por exemplo, para um corpo rígido girando livremente em torno de um eixo fixo, 
sendo q o ângulo de rotação, a cada volta completa q varia de 27 e o estado do sistema 


se repete. 


E Exemplo 9.5.1. Encontre as projeções nos planos de fase do movimento de um oscilador 
harmônico bidimensional. 


Solução. Em coordenadas cartesianas 


1 
H = rPe + Py) + y? (9.5.3) 


e a equação de Hamilton-Jacobi é separável na forma 


W(x, y) = Wi(x) + Waly) , (9.5.4) 
onde 

1 dW, 2 | kz Do =. 

=. ( a) rot = Oe (9.5.5a) 

Al T ) + dy = ay, (9.5.5b) 
com 


H = a1 = ag + Qy , (9.5.6) 
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Tendo em conta que py = dW,/dx e py = dW2/dy, as Egs.(9.5.5) representam elipses nos planos 
de fase (x,pr) e (y, py), respectivamente. Embora ambas as projeções sejam periódicas com 


períodos Ty = 21/wy = 2m(m/ky)!/2 1/2 


e Ty = 2n/wy = 27(m/k,)''“, o movimento no espaço de 
fase só será periódico se as fequências w e wz forem comensuráveis, isto é, se a razão wr/wy 
for um número racional. De fato, se 7 é o período do movimento, a trajetória no espaço de fase 
fecha-se no transcurso de um intervalo de tempo T. As projeções também se fecham, de modo 
que 7 tem que ser um número inteiro de períodos Ty e Ty, OU seja, existem inteiros m e n tais 


que T =m27/wy = n27/wy, donde wz/wy = m/n é um número racional. E 


O pêndulo simples é um sistema particularmente interessante porque pode exibir li- 
bração ou rotação, dependendo do valor da energia. Tomando o nível zero do potencial 


gravitacional no plano horizontal contendo o ponto de suspensão do pêndulo, temos 


ss —mgtcos0 = E. (9.5.7) 
m 
Se E < mgl conclui-se que —0o < 0 < 0) com cos 0) = —E/mgl. O pêndulo oscila 


periodicamente entre —@) e fo, sendo traçada uma curva fechada no espaço de fase. Se 
E > mgl qualquer valor de 6 é possível, e o pêndulo permanece girando indefinidamente 
em torno do ponto de suspensão. O movimento se repete cada vez que o ângulo 0 varia 
de 27, enquadrando-se no caso da Fig. 9.5.1b. Se E = mgl o pêndulo encontra-se numa 
situação limite instável, pois ao atingir a posição vertical 6 = 7 a energia cinética reduz- 
se a zero e o pêndulo poderia permanecer nessa posição para sempre.? Na Fig. 9.5.2 as 
curvas 1 e 2 correspondem a E < mgl, a curva 3 ao caso limite E = mg! e a curva 4 a 
E > mgl. 


Para sistemas multiperiódicos é possível lançar mão das chamadas variáveis de ação e 
ângulo para efetuar o cálculo das freqüências associadas ao movimento, sem a necessidade 
de integrar completamente as equações de Hamilton. Esta técnica foi introduzida original- 
mente por Delaunay na astronomia, onde ela se revela bastante útil porque as freqüências 
dos vários movimentos podem ser mais interessantes do que o comportamento dinâmico 


detalhado. 


As variáveis de ação para um sistema separável multiperiódico com n graus de liber- 


dade são definidas por 


2Supondo a massa m suspensa por uma haste rígida de massa desprezível. 
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Figura 9.5.2: Trajetórias no espaço de fase para um pêndulo simples. 


Ji= $ vida, om (9.5.8) 


onde as integrais estendem-se por um período de libração ou de rotação, conforme o 
caso. Geometricamente, J; representa a área hachurada na Fig. 9.5.1a ou 9.51b, de- 
pendendo do caso. Pela Eq.(9.5.2), os J; são funções de aj,...,Q@, ou, inversamente, 
a; = a;(J1,...,J,). Substituindo estas últimas expressões na integral completa (9.5.1) 
da equação de Hamilton-Jacobi independente do tempo resulta uma outra integral com- 
pleta W(q,.--,Gn;J1,---,In) onde, agora, as constantes J; é que são identificadas com 
os novos momentos P;. Considerando a transformação canônica gerada por W(q,J), a 


hamiltoniana transformada é 


K = H = œ Gy hy eagle) EM acorda (9.5.9) 


ou seja, a nova hamiltoniana K é simplesmente a hamiltoniana original H expressa como 


função das variáveis de ação . 


As variáveis canônicas conjugadas aos J;, conhecidas como variáveis angulares wi, 


são definidas por 


(9.5.10) 


As equações de movimento para os w; escrevem-se 
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OK OH 
i i, 9.5.11 
TE Dh a 
onde os v; também são constantes, pois só dependem das constantes J,...,Jn. A solução 
das equações (9.5.11) é imediata: 


A fim de elucidar o significado físico dos v’s, suponhamos que o sistema seja periódico 
com período 7. Evidentemente, a projeção do movimento sobre cada plano de fase também 
é periódica e as razões das frequências correspondentes são números racionais. Em outras 
palavras, depois de um tempo? 7 cada grau de liberdade terá executado um número 
inteiro de voltas completas. A mudança correspondente em cada variável angular deve-se 
à variação das coordenadas qk, pois os J’s são constantes. Portanto, num período do 


movimento no espaço de fase temos 


eidg o OW 


onde usamos (9.5.10) e invertemos a ordem de diferenciação. Usando (9.5.1) e (9.5.2) 


podemos reescrever (9.5.13) na forma 


_ a ƏW,, ð 


Se ny é o número de voltas completas descritas pela coordenada q;, , temos 
o 
Aw; = — So nde = Nh; . (9.5.15) 
OiT 
Por outro lado, 


3Geralmente longo para sistemas periódicos com um grande número de graus de liberdade. 
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onde 7; é 0 período associado ao i-ésimo grau de liberdade, e, pela Eq.(9.5.12), 


AW; = V;T . (9.5.17) 


Destas três útimas equações deduz-se imediatamente 


Due) y t= ln; (9.5.18) 


de modo que os v; são as freqüências fundamentais do sistema, isto é, as freqüências 
do movimento periódico executado por cada grau de liberdade. Em síntese, as derivadas 
parciais da hamiltoniana em relação às variáveis de ação fornecem as freqüências funda- 


mentais. 


E Exemplo 9.5.2. Encontre as freqiiéncias fundamentais de um oscilador harmônico bidimen- 
sional pelo método das variáveis de ação. 


Solução. A equação (9.5.5a) pode ser escrita na forma 


2 2 
x / VETETT 


que é a equação de uma elipse no plano de fase (x, pr). A variável de ação J, coincide com a 
área dessa elipse, isto é, 


Jz = Tab = 27, dia Bugs (9.5.20) 
key 
Analogamente, 
Jy = 2m, Da. (9.5.21) 
ky 
Conseqüentemente, 


1 m 1 
H =a, = Oy + Qy E J, 4 EE Jy (9.5.22) 


donde 
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OH 1 m OH 1 im 
nee See i, fi E ls 9.5.23 
“DT InV kz 2 dd, 27V ky ( 
que é o resultado correto para as frequências das oscilações nas direções x,y. E 


9.6 Sistemas Integráveis e Teorema KAM 


A noção de integrabilidade de um sistema mecânico refere-se à possibilidade de re- 
solução explícita de suas equações de movimento. Por exemplo, no caso de um sistema 
conservativo unidimensional constituído por uma só partícula, o fato de a energia ser 


constante permite escrever a solução da equação de movimento na forma 


(9.6.1) 


m f? dé 
ae eon 


Basta agora uma inversão adicional para se obter a solução x(t): o problema de uma 
partícula em movimento unidimensional sob a ação de uma força conservativa pode ser 
resolvido por uma quadratura. O pião simétrico com um ponto fixo é um sistema com três 
graus de liberdade que possui três constantes de movimento independentes: py, py e H. 
O parêntese de Poisson de qualquer par dessas três constantes de movimento é nulo. Como 


vimos na Seção 4.10, as equações de movimento do pião resolvem-se por quadraturas. 


Definição 9.6.1. As m variáveis dinâmicas Fi(g,p),..., Fm(q,p) estão em involução 


se o parêntese de Poisson de quaisquer duas delas é zero: 


{F,,F}=0 , kl=1,...,m. (9.6.2) 


No Exemplo 8.5.1, com dois graus de liberdade, N e H sao constantes de movimento 
em involução sem dependência temporal explícita. No Exemplo 9.3.2 obtivemos facil- 
mente uma integral completa da equação de Hamilton-Jacobi associada por separação de 
variáveis, e as equações de movimento foram resolvidas por quadraturas. De maneira geral, 
caso, por separação de variáveis, consigamos encontrar uma integral completa S(q, a, t) 
da equação de Hamilton-Jacobi para um sistema com n graus de liberdade, as variáveis 
canônicas transformadas Q, = 08/da, formam um conjunto de n constantes de movi- 


mento claramente em involução e as equações de movimento resolvem-se por quadraturas. 


396 CAPÍTULO 9. TEORIA DE HAMILTON-JACOBI 


Parece, portanto, que a integrabilidade de uma sistema com n graus de liberdade está in- 
timamente associada à existência de n constantes de movimento em involução. Em 1840, 
Liouville demonstrou que se um sistema hamiltoniano com dois graus de liberdade possui 
duas constantes de movimento independentes em involução, então suas equações de movi- 
mento podem ser resolvidas por quadraturas. O teorema foi posteriormente generalizado 


e, neste século, enriquecido pela contribuição de Arnold. 


Lema 9.6.1 Se um sistema hamiltoniano conservativo com n graus de liberdade 
admite n constantes de movimento em involução Fi(g,p),...,Fa(q,p) e a matriz com ele- 
mentos Wa = OF;,/Op, é não-singular, existem variáveis canônicas (w1,...,Wn,J,...,Jn) 
tais que H = H(Ji,..., Jn). 


Demonstração. Aqui nos baseamos em Pars (1965), Berry (1978) e Scharan (1982). 


Sejam F},..., Fa constantes de movimento em involução com det(OF;,/Op,) £ 0. Defina 
os candidatos a novos momentos Jj,..., Jn por 
Je = Flap) , k=1,... n. (9.6.3) 


Conforme o teorema da função implícita, estas equações podem ser resolvidas para os p's 


na forma 


pk = Ux(q, J) ; sa ae (9.6.4) 


Portanto, 
Fela yla J) =J , K=l,...,n (9.6.5) 


donde, diferenciando em relação a qı, vem 


OF, Ow, OF, OWs 
Ei edi Es RS, 9.6.6 
qı Ee Op, On On 2 “= Ig ee) 
Por outro lado, explicitando {F}, Ft = 0 temos 
OF, OF, OF, o) 
_ =0, 9.6.7 
E Oq; Op; Op; Oq; ER 


que, com o emprego de (9.6.6), torna-se 


9.6. SISTEMAS INTEGRAVEIS E TEOREMA KAM 307 


Os Obs 
ES Cap ee We WO 9.6.8 
2 Spy 2 Aq) wee) 


ou, com a troca j +> s dos índices mudos do segundo somatório, 


Os Sé) 
Was ii Wi =0. 9.6.9 
> k (5 aqs lj ( ) 


Definindo a matriz X com elementos 
E OW, Obs 


X, = Tea 9.6.10 
dqs qr l ) 


podemos exprimir (9.6.9) em notação matricial como 


WXW' =o. (9.6.11) 


1 


Como W tem inversa, multiplicando esta equação pela esquerda por W`? e pela direita 


por (W7T)-! resulta X = 0, isto é, 


Ov, Obs 
= : 9.6.12 
O DE ( ) 
De acordo com o Apêndice D, existe uma função (q, J) tal que 
99(g, J) 
Prq, J) = 20" . 9.6.13 
an= E (9.6.13) 
Assim, pela Eq.(8.1.15), a transformação (q,p) — (w, J) definida por 
O® oP 
tees y = 9.6.14 
Ue ay DES ae ( ) 


é canônica com função geradora (q, J). Como os J’s são constantes de movimento, 


as equações de Hamilton transformadas J, = —0H/ôw, estabelecem que 0OH/dw; = 0. 


Logo, H não depende dos w's e a demonstração está completa. 
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Definição 9.6.2. Um sistema hamiltoniano conservativo com n graus de liberdade 
e hamiltoniana H(q,p) é dito completamente integrável ou, simplesmente, integrável se 


existem n constantes de movimento independentes em involução, isto é: 
(aye enya. s i=1,...,n ; 
(DO , ij=1,...,n ; 
(c) os vetores V F; são linearmente independentes em cada ponto do espaço de fase.! 


Agora estamos prontos para enunciar o resultado central a respeito de sistemas hamil- 


tonianos integráveis. 


Teorema (Liouville-Arnold). Considere um sistema hamiltoniano integrável com 


n graus de liberdade. Então: 


(a) Existem variáveis canônicas (w1,..., Wn, J1,---, Jn) tais que H = H(J,..., Jn), 


de modo que a solução das equações de movimento nas novas variáveis é 


J, = constante , w,p=w,(0)+%t , K=1,...n, (9.6.15) 


onde vk = OH/OJ;, . 


(b) As equações de Hamilton nas variáveis originais (q,p) podem ser resolvidas por 


quadraturas. 


(c) Se o conjunto das hipersuperfícies de nível das constantes de movimento em involução 
Fy , definido por 


Me = {(a,p) | Fala, p) = Ch patel (9.6.16) 


5 


é compacto e conexo,” as variáveis canônicas (J,w) são variáveis de ação-ângulo e o 


movimento é multiperiódico com frequências vy = 0H/0J.. 


“Aqui V = 0/0z= (0/001,...,0/0qn,0/0p1,...,0/0pn) é o operador nabla no espaço de fase (q, p). 
5No presente contexto, compacto significa a mesma coisa que fechado e limitado. Um conjunto é conexo 
se não é a união de conjuntos disjuntos. 
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Demonstração. Alguns momentos de reflexão bastam para mostrar que a condição 
(c) da Definição 9.6.2 equivale a dizer que uma das matrizes quadradas com elemen- 
tos OF;/0z,, onde s toma n valores no conjunto {1,2,...,2n}, é não-singular. Se al- 
guns dos z's coincidirem com alguns dos q's, podemos fazer uma transformação canônica 
que troca cada um desses q's pelo seu momento conjugado (vide Exercício 8.1.1). Por- 
tanto, sem perda de generalidade, podemos supor que s = n+ 1,...,2n, de modo que 
det(OF;/Op;) + 0. Pelo Lema 9.6.1, existem variáveis canônicas (w, J) tais que a hamil- 
toniana transformada só depende dos J’s e as equações de Hamilton nas novas variáveis 
são solúveis na forma (9.6.15), o que prova (a). Para obter a função geradora ®(q, J) 
da transformação canônica (q,p) — (w, J) basta resolver o sistema de equações (9.6.3) 
para os p's e integrar ao longo de uma linha reta uma função construída com as funções 
supostamente conhecidas w;(q, J) (vide Eq.(D.7) do Apêndice D). Assim, a determinação 
das variáveis canônicas originais como funções do tempo só requer a inversão e a inte- 
gração de funções conhecidas, de modo que as equações de Hamilton originais resolvem-se 
por quadraturas. Isto prova (b). A parte (c) refere-se à estrutura global do espaço de 
fase e sua demonstração será omitida, pois requer o recurso a argumentos topológicos, de 
teoria dos grupos e de geometria diferencial com os quais não supomos que o leitor esteja 
familiarizado. O leitor interessado numa prova detalhada de (c) deve consultar a literatura 
pertinente (Arnold 1976; Thirring 1997). 


Se o movimento de um sistema integrável é limitado, a região acessível do espaço de 
fase é finita e Mc é uma variedade compacta. Pelo item (c) do teorema, Mc é descrita 
por n ângulos, logo coincide com um toro n-dimensional. Usando as variáveis canônicas 
definidas acima, as equacões J; = Cp definem em que toro o sistema se encontra, ao passo 
que os w's são coordenadas sobre o toro. Uma órbita que comece num desses n-toros nele 


permanece para sempre, por isso eles são chamados de toros invariantes. 


Na mecânica estatística, a fim de evitar a necessidade do cálculo de médias temporais 
em intervalos de tempo excessivamente longos, uma suposiçao fundamental é feita — a 
famosa hipótese ergódica. Segundo essa hipótese, no curso do tempo o sistema explora toda 
a região do espaço de fase energeticamente disponível (a chamada superfície de energia) e 
acaba por cobrir essa região uniformemente. Isto permite substituir médias temporais por 
médias sobre a superfície de energia no espaço de fase. No caso de um sistema integrável, 
a existência de n constantes de movimento independentes implica que cada trajetória 
do sistema pode explorar no máximo uma variedade n-dimensional no espaço de fase de 
dimensão 2n. Exceto no caso trivial em que n = 1, tal variedade é menor do que a 
superfície de energia, cuja dimensionalidade é 2n — 1. Portanto, a hipótese ergódica é 


falsa em geral. 
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Uma pergunta natural é a seguinte: a integrabilidade constitui a regra ou a exce- 
ção? Os problemas que estão resolvidos exatamente nos textos de mecânica são todos 
integráveis, o que pode provocar a falsa impressão de que os sistemas integráveis são 
genéricos. Sabe-se que isto não é verdade. Os sistemas integráveis são os que costumam ser 
considerados nos livros de mecânica pelo simples fato de serem analiticamente solúveis, mas 
constitem menos a regra do que a exceção. Um exemplo importante de não-integrabilidade 
é caso geral do célebre problema dos três corpos da mecânica celeste. O surpreendente, no 
entanto, é que a não-integrabilidade pode se manifestar em sistemas mecânicos tão simples 


quanto o pêndulo duplo, que tem apenas dois graus de liberdade (Shinbrot et al. 1992). 


Uma questão relacionada, mas um pouco diferente, é se a integrabilidade resiste a 
pequenas perturbações. Juntamente com Fermi, muitos físicos teóricos acreditavam que 
a mais ligeira perturbação de um sistema integrável destruiria a integrabilidade, o que 
tenderia a validar a hipótese ergódica e, consequentemente, a mecânica estatística. O que 
ocorre, no entanto, é que em sua “maioria” os toros sobrevivem a uma perturbação, embora 
em forma distorcida. Se a perturbação é suficientemente pequena, os toros que são apenas 
deformados preenchem a maior parte do espaço de fase. Os toros destruídos distribuem-se 
entre os que são preservados de uma maneira extremamente irregular. Isto foi demonstrado 
rigorosamente por Vladimir I. Arnold e Jürgen Moser, independentemente, em 1962, com 
base em sugestões feitas por A. N. Kolmogorov em 1954, e tornou-se conhecido como 


teorema de Kolmogorov-Arnold-Moser ou, abreviadamente, “teorema KAM”. 


A variedade em que se desenrola o movimento de um sistema integrável com hamilto- 
niana Ho(J) é um n-toro T”. Suponhamos que as frequências 14,...,Vn Sejam incomen- 
suráveis, ou, mais precisamente, que elas sejam racionalmente independentes, isto é, dados 


n números inteiros M1,..., Mn tenhamos 


XO we 0 <> M= = i, = 0. (9.6.17) 
k=1 


Depois de transcorrido um tempo suficientemente longo, a órbita retorna a uma vizinhança 
arbitrariamente pequena do ponto de partida sobre T” mas não se fecha: dizemos que 
as órbitas são densas em T”. O movimento é dito quase-periódico e o toro percorrido 
pela trajetória do sistema é chamado de toro não-ressonante. Quando as frequências são 
racionalmente dependentes os toros são ditos toros ressonantes. Consideremos agora a 


hamiltoniana perturbada 


H(w, J;e) = Ho(J) + «Mi (wu, J) . (9.6.18) 
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O problema fundamental consiste em determinar se, e em que sentido, este sistema é 
estável: a perturbação modifica apenas ligeiramente os movimentos do sistema descrito 
por Ho(J) ou os destrói completamente? Em larga medida, esta pergunta é respondida 


pelo teorema de Kolmogorov, Arnold e Moser. 


Teorema KAM. Se as freqiiéncias de um sistema hamiltoniano integrável Ho são 
racionalmente independentes e suficientemente irracionais,? então, para e€ suficientemente 
pequeno, as soluções do sistema perturbado (9.6.18) são preponderantemente quase-perió- 
dicas e só diferem ligeiramente das do sistema não-perturbado. Em sua maioria, os toros 
nao-ressonantes de Hp são apenas levemente deformados e o sistema perturbado também 


possui toros não-ressonantes, sobre os quais as órbitas são densas. 


O teorema foi propositalmente enunciado numa forma um tanto qualitativa para não 
afogar o leitor em tecnicalidades. Para a formulação precisa e a demonstração rigorosa, 
que é longa, intrincada e sutil, o leitor interessado é remetido aos trabalhos originais de 
Kolmogorov (1957), Arnold (1963) e Moser (1962). Demonstrações simplificadas — mas 
ainda assim muito difíceis — de casos particulares do teorema encontram-se em Thirring 
(1997) e Chandre & Jauslin (1998). As idéias essenciais da demonstração estão expostas 


com preocupação didática em José & Saletan (1998) e, sobretudo, em Berry (1978). 


O teorema KAM dá bons resultados no que tange à estabilidade a longo prazo, embora 
sob hipóteses um pouco restritivas, e funciona bem na descrição de aspectos qualitativos do 
problema restrito de três corpos, por exemplo. Infelizmente, a estabilidade do sistema solar 
não fica inequivocamente estabelecida porque o sistema planetário como um todo parece 
estar fora da gama de aplicabilidade do teorema, o qual, além do mais, é omisso quanto ao 
destino dos movimentos com frequências racionalmente dependentes. As órbitas às quais 
o teorema não se aplica estão densamente distribuídas no conjunto das órbitas abrangidas 
pelo teorema, de modo que os sistemas hamiltonianos em geral apresentam uma mistura 
complicada de movimentos regulares com movimentos irregulares, dando margem a sus- 
peitas de comportamento caótico. As chamadas lacunas de Kirkwood (vazios no cinturão 
de asteróides entre Marte e Júpiter a distâncias do Sol em que os períodos de revolução 
não-perturbados do asteróide e de Júpiter são comensuráveis), descobertas em 1866, po- 
dem ser interpretadas com base no teorema KAM como resultantes da destruição de toros 
invariantes na vizinhança das frequências ressonantes (Berry 1978). Esta explicação, no 


entanto, não é considerada conclusiva nem a mais plausível. Cálculos recentes parecem 


Diz-se que as n fregiiências racionalmente independentes v1,..., Vn são suficientemente irracionais 


se existem números reais positivos a > n e 8 tais que a condição diofantina |S my vk| > Blm[Tº é 
satisfeita qualquer que seja o vetor m = (m1,...,™n) #0 cujas componentes são números inteiros. 
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indicar que as lacunas de Kirkwood devem ser atribuídas ao comportamento caótico de 


sistemas hamiltonianos (Wisdom 1987; Lissauer 1999). 


9.7 Variáveis de Ação no Problema de Kepler 


Pelo papel que desempenhou no desenvolvimento da mecânica quântica, o tratamento 
do problema do movimento ligado de uma partícula sujeita a uma força central coulom- 
biana pelo método das variáveis de ação-ângulo é de considerável interesse histórico. O 


potencial 


Vir)=-— , k>0, (9.7.1) 


é da forma considerada no Exemplo 9.3.1, com a(r) = —k/r e b(0) = 0. Portanto o 


sistema é separável e multiperiódico, de modo que as variáveis de ação escrevem-se 


27 
Jp = $ pede = aa, dp = Td (9.7.2) 
Jo = $ pod = ido = = f yo? — a2 / sen20 do, (9.7.3) 


J, = foar = far = f aman E ar (9.7.4) 


onde usamos as equações (9.3.18) e (9.3.19). As integrais (9.7.3) e (9.7.4) podem ser 
elegantemente calculadas usando técnicas de integração no plano complexo (Goldstein 


1980; Saletan & Cromer 1971), mas vamos preferir fazê-lo por métodos elementares. 


Necessariamente aj — a%,/sen?@ > 0, de modo que 0 < 0 < m — o onde sento = 
a,/ag. Para o cálculo da integral (9.7.3) devemos tomar a raiz quadrada positiva (pg > 0) 
na região em que 0 cresce de 0) a 7 — 06 e raiz quadrada negativa (pp < 0) na região 


em que 6 decresce de m — ĝo a 66, fechando o circuito. Assim, 


—0 


(1 - 2 “ao (9.7.5) 


sen20 


n=2[" — a2 “do = 20 |” 
9 “Va a? / sen a 
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A fim de tornar simétrico o intervalo de integração é conveniente introduzir a nova variável 


Ww definida por 0 = y + 7/2 e o ângulo po = 7/2 — bo, de tal maneira que 


bo cos Ei 1/2 vo «/ senZy — sent , 
Jo = 20% | dy = 4a o | 9.7.6 
te = cos? J) y= cos 4 o l ) 
onde 
cos Yo = sendo = a,/ag . (9.7.7) 


A forma do integrando em (9.7.6) sugere a mudança de variáveis 


senw = sen Yo senu , (9.7.8) 
que resulta em 
jee T e E i f ae cos Yo Ja (9.7.9) 
= 4a, u = 4a — u. lo 
‘ oe T= sen21/p sen?u “Jo 1 — sen?wWo sen?u 


Com o emprego da férmula (Gradshteyn & Ryzhik 1980) 


d. 
Pe = (1 — k?)-¥/? tan} (71 — k? tan x) ; |k] <1 3 
obtemos, finalmente, 


Jo = 2r7ag(l — cos Yo) = 27(ag — ag) . (9.7.10) 


Quanto à variável de ação radial, temos 


Imk 
i =o” Jmn E Sha, (9.7.11) 
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onde r, e r_ são as raízes de 


mk a 
ea RO TE, (9.7.12) 
q” T 


Evidentemente, estamos considerando E < 0, pois apenas neste caso o movimento é 
periódico e a variável radial é limitada. Escrevendo a, = E = —e com € > 0, as soluções 
de (9.7.13) são 


k + \/k? — 2ea3/m 
= (9.7.13) 


2€ 


Usando a fórmula (Gradshteyn & Ryzhik 1980) 


V A 2 2 
if avers dx = Va + bx + cx? + /—asen'( A) 3 : sen |( aa) , 


válida para a < 0, c< 0 e A = b? — 4ac > 0, deduz-se facilmente 


2M; 1/2 
J, = ~2nag + (5) k (9.7.14) 
Combinando este resultado com as Eqs.(9.7.2) e (9.7.10) obtém-se 
2r?°mk? 
Fo 9.7.15 
(Jp + Jo + do)? l ) 
donde 
OH An?mk? 8E3 \1/2 
Rs Ee 9.7.16 
TO. Osis (ame) tT) 


Há uma degenerescéncia completa, pois as demais freqtiencias vg e v, sao iguais a Vr. 
Sendo iguais entre si, as três frequências são comensuráveis. Isto inevitavelmente teria 
que ocorrer em virtude de o movimento da partícula ser periódico, já que para E < 0 as 


órbitas são fechadas (circunferências ou elipses). 
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9.8 Invariantes Adiabaticos 


Consideremos um sistema mecânico com um parâmetro característico À e suponhamos 
que, sob a influência de agentes externos, À varie muito lentamente (“adiabaticamente”). 
Por exemplo, uma massa m suspensa por um fio de comprimento ¢ pode estar executando 
pequenas oscilações com um período T. Se @ for gradualmente reduzido, puxando-se o fio 
através de um buraco no teto, de modo que variações sensíveis de £ só ocorram numa escala 
de tempo T >> 7, dizemos que o pêndulo está sofrendo uma transformação adiabática. 
Uma grandeza física que permanece constante durante uma transformação adiabática é 


dita um invariante adiabático. 


Mostremos que, para um oscilador harmônico de fregiiência lentamente variável, a 


grandeza E/v é um invariante adiabático. A energia total de um oscilador harmônico é 


m 
E=—x 
gm 


ae (9.8.1) 


A freqiiéncia angular w poderia estar variando lentamente porque w? = g/L, como no caso 
do pêndulo, com £ variando adiabaticamente. Qualquer que seja o mecanismo, podemos 


escrever 


d 
DE e mix + mw? xk + musa (9.8.2) 


Esta equação contém termos rápidos e termos lentos. Durante um intervalo de tempo 
necessário para que os termos lentos E e w variem significativamente, os termos rápidos 
executam um grande número de oscilações, de modo que podemos substituí-los por seus 


valores médios num período de oscilação. Assim procedendo, ficamos com 


dE 
dt 


= (mit + mw’ rt) + (muwa?) (9.8.3) 


A média do primeiro termo num ciclo é zero e (mwax?) = E/w, donde 


E 
— = — = — = constante . (9.8.4) 
W 


Levando em conta que v = w/27 podemos escrever 
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E 
— = invariante adiabático , (9.8.5) 
v 


como pretendíamos demonstrar. 


Inspecionando a Eq. (9.5.22) verifica-se que E/v é exatamente a variável de ação J 
do oscilador, de modo que para um oscilador harmônico unidimensional a variável de ação 
é um invariante adiabático. Desejamos mostrar, a seguir, que isto não é uma peculiari- 
dade do oscilador, mas uma propriedade geral das variáveis de ação. Seja H(q,p;A) a 
hamiltoniana do sistema, suposto unidimensional. Quando À é constante, sejam (J, w) 
as variáveis de ação-ângulo tais que H = H(J;A). É conveniente tomar para a trans- 
formação canônica (q, p) — (w, J) uma função geradora do tipo W*(q, w; A), que está 


relacionada a W (q, J; A) por 


W*(q,w3A) = Wq, J; A) -wJ , (9.8.6) 


como se depreende de (8.1.13a). Quando A varia com o tempo, W* adquire uma de- 


pendência temporal explícita e a hamiltoniana transformada é 


ow* - OW* 


K(w, J; 4) = HU A) + = = HUA) +A (9.8.7) 


Agora a variável de ação J não é mais constante de movimento, mas satisfaz a equação 


de Hamilton 


. OK - O2W* 
J = ~~ Bie =. —À ðwðA . (9.8.8) 


No caso de uma perturbação adiabática, À é uma quantidade muito pequena, de modo 
que J também varia lentamente. As variáveis lentas À e J mudam pouco durante um 
período de oscilação do sistema não perturbado. Assim como fizemos no problema do 
oscilador, podemos obter uma versão aproximada para a equação (9.8.8) substituindo o 
coeficiente de À em (9.8.8) por seu valor médio num ciclo do sistema não perturbado, 


resultando” 


7A substituição de (9.8.8) por (9.8.9) costuma ser chamada de princípio da média (Arnold 1976). 
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i . o2W* 
J= =- —) . 9.8.9 

(50X) ( ) 
Da generalização das equações (9.2.11) e (9.2.12) para um potencial arbitrário V (q; A) 


vemos que W exprime-se por meio da integral indefinida 


W = fpa , (9.8.10) 


de modo que num ciclo do sistema não perturbado W aumenta de J. Ao mesmo tempo, 
wJ também aumenta de J porque, de acordo com a Eq.(9.5.15), w cresce de uma unidade 
em cada ciclo completo, ao passo que J permanece constante. Portanto, a Eq.(9.8.6) 
assegura que W* é uma função periódica de w com período 1. O mesmo ocorre com sua 


derivada parcial em relação a A, que admite a expansão em série de Fourier 


ae ye An Ae (9.8.11) 
Or m=-—00 
Conseqtientemente, 
aa = QrimAm( J; Nem = 3º QrimAm(J;A)(e2"™”) =0 9.8.12 
(A) = (D 2mimAn(; erm) = Y 2rimAm(J; A) (e) =0 , (9.8.12) 


m#0 m#0 


porque o termo constante está ausente da soma em (9.8.12) e todos os outros termos têm 


média zero num ciclo completo. Levando este resultado em (9.8.9) resulta 


J=0, (9.8.13) 


o que estabelece a invariância adiabática da variável de ação. O princípio da média pode 
ser justificado pelo teorema da média, conferindo pleno rigor matemático aos argumentos 


que conduzem à invariância adiabática das variáveis de ação (Arnold 1976). 


EH Exercício 9.7.1. Uma partícula desliza sobre uma superfície horizontal sem atrito, oscilando 
livremente entre duas paredes verticais separadas por uma distância L. Se as colisões da partícula 
com as paredes são elásticas e a distância entre as paredes é variada lentamente, prove que 


EL? = invariante adiabatico. E 
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Os invariantes adiabáticos encontram aplicação numa extensa gama de situações de 
interesse físico (Gleiser & Kozameh 1980; Crawford 1990). Especialmente importantes 
são os problemas envolvendo movimento de uma partícula num campo eletromagnético 
externo, cujos invariantes adiabáticos associados ajudam a explicar certos fenômenos ob- 
servados em astrofísica e física de plasmas, além de desempenhar um papel significativo 


na teoria dos aceleradores de partículas (Crawford 1990). 


9.9 Teoria de Hamilton-Jacobi e Mecânica Quântica 


Na época da chamada “velha teoria quântica”, fase de transição entre a descoberta 
do quantum de ação por Planck (1900) e a formulação da mecânica quântica moderna 
por Heisenberg, Born, Jordan, Dirac e Schrédinger (1925-26), o método mais geral então 
conhecido de obter os níveis de energia de sistemas microscópicos consistia em impor as 


condições quânticas 


onde os n; eram números inteiros. As condições (9.9.1), conhecidas como regras de 
quantização de Wilson-Sommerfeld ou Bohr-Sommerfeld, davam bons resultados para 
sistemas simples como o oscilador harmônico, o rotor rígido e o átomo de hodrogênio, este 
último mesmo com a inclusão de correções relativísticas. No caso do átomo de hidrogênio, 


por exemplo, escrevendo k = e? em unidades eletrostáticas CGS, impondo 


Sed , Jao=ngh , Jop =nNeh , (9.9.2) 


e usando (9.7.15) encontram-se os níveis de energia corretos 


met 


En = — 55a 3 5 = Zi 5 (9.9.3) 


onde n=n,+no+n, e h=h/27. Segundo a hipótese adiabática de Ehrenfest, “se um 
sistema é afetado de um modo adiabático reversível, movimentos permitidos são transfor- 


mados em movimentos permitidos.” Com base nesse princípio heurístico, e mostrando que 


“Eis aqui um belo exemplo de um dos aspectos mais fascinantes da física teórica. Introduzidas original- 
mente no domínio do muito grande (mecânica celeste), as variáveis de ação revelaram-se mais importantes 
no domínio do muito pequeno (física atômica). 
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sistemas mecanicos complicados podem ser adiabaticamente transformados em sistemas 
mecânicos simples, Ehrenfest explorou a invariância adiabática das variáveis de ação para 
justificar as regras de quantização de Bohr-Sommerfeld (van der Waerden 1966). Essas 
regras não podiam representar a última palavra, no entanto, porque fracassavam rotun- 


damente quando aplicadas a átomos com mais de um elétron ou a moléculas diatômicas. 


A teoria de Hamilton-Jacobi desempenhou um papel crucial na construção da “mecâni- 
ca ondulatória” por Schrodinger, apoiado na analogia entre a mecânica e a óptica geométri- 
ca desenvolvida por Hamilton no período de 1828 a 1837. Por simplicidade, limitaremos 
a discussão ao problema de uma partícula no potencial V (x,y,z) em coordenadas carte- 
sianas, embora a análise possa ser estendida a sistemas muito mais gerais (Schrödinger 


1982). A equação de Hamilton-Jacobi em coordenadas cartesianas 


sm (Se) + Ge) + Ge) | + Vino + Fo (9.9.4) 
possui uma integral completa da forma 
S(x,y, z, t) =W (x,y,z) = Eb; (9.9.5) 
onde a função característica de Hamilton satisfaz 
(VW) =2m(E-V) , (9.9.6) 


sendo E a energia total (constante) da partícula. Consideremos, seguindo Hamilton, a 


família contínua de superfícies definidas pela equação 
S(#,y,z,t) = W(a,y,z) —Et=C , (9.9.7) 
onde C é uma constante. De 
p= VW (9.9.8) 


conclui-se que, em cada instante t, a trajetória da partícula é perpendicular à superfície 
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Figura 9.9.1: Frentes de onda ou superficies de fase constante na analogia entre mecanica 
e óptica geométrica. 


definida por (9.9.7). Em outras palavras, pode-se obter todas as trajetórias mecânicas 
possíveis por meio da construção das trajetórias ortogonais às superfícies S = constante. 
Isto sugere interpretar as trajetórias mecânicas do mesmo modo que os raios luminosos 
da óptica geométrica, sendo S encarada como a fase de um processo ondulatório fictício. 
A velocidade de fase do referido processo pode ser determinada como se segue. Considere 
duas frentes de onda ou superfícies de fase constante nos instantes t e t+ dt, respectiva- 
mente. Seja dé a distância ao longo da normal entre um ponto P da primeira superficie 
e o ponto correspondente P’ da segunda superfície, como mostra a Fig. 9.8.1. Como S 
tem o mesmo valor nas duas frentes de onda, a equação (9.9.7) fornece dW — Edt = 0. 


Por outro lado, de acordo com (9.9.6), 


Edt = dW = |V Wi|dt = (2m(E = V) dt , (9.9.9) 


o que determina a velocidade de fase u como sendo 


u=—= l (9.9.10) 


E Exercício 9.7.1. (i) Mostre que a velocidade de fase (9.9.10) não coincide com a velocidade 
da partícula. Esse descompasso parece inviabilizar a pretensão de encarar S como a fase de um 


processo ondulatório associado à partícula. (ii) No entanto, pode-se mostrar (Jackson 1975) que 
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a velocidade de um pacote de ondas formado pela superposição de ondas numa faixa estreita 
de frequências é a velocidade de grupo dada por vg = dw/dk, onde k é o vetor número de 
onda. Partindo da expressão para w(k) determinada por meio de (9.9.6), (9.9.8), da relação de 
Planck E = hv e da relação de de Broglie p = hk, prove que a velocidade de grupo é idêntica 


à velocidade da partícula. E 


Essa analogia entre mecânica e óptica geométrica induziu Erwin Schrodinger a pensar 
que se a mecânica clássica fosse apenas uma forma aproximada de uma mecânica com 
características ondulatórias, sua falha em escala microscópica poderia ser entendida como 
análoga ao fracasso da óptica geométrica na explicação dos fenômenos de interferência 
e difração (Schrödinger 1982). Assim, em sua segunda comunicação da série intitulada 
“Quantização Como um Problema de Autovalores”, publicada em 1926, Schrödinger con- 
jecturou que S deveria ser a fase de um processo ondulatório verdadeiro Ų expresso 


por? 


y = exp(4S) = epf i-t +W(zx,y, al} l (9.9.11) 


Ora, um processo ondulatório com velocidade de fase u é tipicamente governado pela 


equação de onda 


1 ow 
VU — EF 0. (9.9.12) 


Substituindo nesta equação a velocidade de fase (9.9.10) e a função de onda Y da forma 
(9.9.11) resulta 


h2 
=o +VW=EV , (9.9.13) 


que é a célebre equação de Schrédinger independente do tempo. Levando em conta (9.9.11), 


esta última equação é equivalente a 


nh? ow 
-— VU + VU = ih 9.9.14 
2m ðt * ( ) 
°A presença da constante h = h/2r em (9.9.11) tem por finalidade garantir que a freqüência seja dada 
pela relação de Planck E = hv. 
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que é a equação de Schrodinger dependente do tempo. 


Esses argumentos heuristicos, a despeito de seu grande poder de convencimento e 
irresistível beleza, não constituem uma dedução da equação de Schrodinger. Procedendo 
de forma inversa, isto é, postulando a Eq. 49.9.14) e escrevendo Ų da forma (9.9.11), 


verifica-se imediatamente que a equação obedecida por S é 


oS ih 


1 
Ot 2m 


2m 


(VS) +V 4 V7s=0. (9.9.15) 


No limite clássico A — 0 esta equação reduz-se à equação de Hamilton-Jacobi (9.9.4). 
Equivalentemente, se a ação S associada à trajetória clássica é muito maior do que À, 
a fase da função de onda W coincide com a ação clássica que é solução da equação de 
Hamilton-Jacobi. Assim como o limite clássico da mecânica quântica na formulação de 
Heisenberg é a mecânica clássica expressa na linguagem dos parênteses de Poisson, o limite 
clássico da mecânica quântica na formulação de Schródinger é a teoria de Hamilton-Jacobi. 
Incidentalmente, a Eq.(9.9.11) explica porque a equação de Hamilton-Jacobi é separável 
na forma de soma nos mesmos sistemas de coordenadas em que a equação de Schródinger 


é separável na forma de produto. 


Como p= VS, no limite clássico a trajetória da partícula é ortogonal à superfície de 
fase constante da função de onda Y. No limite clássico, portanto, os “raios” associados 
a W são as trajetórias possíveis da partícula. Neste sentido, a mecânica clássica é um 
caso limite da mecânica quântica da mesma forma que a óptica geométrica é um caso 
limite da óptica física. É tentador imaginar que, se tivesse sido suficientemente audacioso, 
Hamilton poderia ter proposto a mecânica clássica como um autêntico caso limite de uma 
mecânica com características ondulatórias, antecipando em quase um século o advento da 
mecânica quântica. No entanto, a ausência de suporte experimental provavelmente teria 
levado os físicos da época a pôr de lado tal proposta como um mero delírio especulativo 


sem fundamento. 
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PROBLEMAS 


9.1. Uma partícula move-se em uma dimensão no potencial V(x) = k/x? , k > 0. Dadas 
as condições iniciais x(0) = xo e (0) = 0, determine x(t) pelo método de Hamilton- 


Jacobi. 


9.2. A lagrangiana de uma partícula em coordenadas cilíndricas é 


L= > + pe +) -Vlo 9,2) . 


Introduza as coordenadas parabólicas (€,n,y) definidas por 


com € >0 emn>0. Mostre que, inversamente, 


E=r+tz , n=r-z , onde r= yp?4+2?. 


Prove que a hamiltoniana em coordenada parabólicas tem a forma 


o DEEM Dao Oe 


H= | EFV(E nd). 
E ET mé (€n, p) 
Se 
pes E 
E+ 


com a(é) e b(n) funções arbitrárias, mostre que a equação de Hamilton-Jacobi inde- 
pendente do tempo é separável e obtenha uma integral completa. Considere o efeito 
Stark, isto é, a ação de um campo elétrico uniforme sobre um átomo de hidrogênio. 
Desprezando o movimento do próton e escolhendo o eixo z paralelo a E, mostre que 
V = —k/ VP+ 27+ eEz , k > 0. Comprove que, expresso em coordenadas parabólicas, 
este potencial é da forma acima e identifique as funções a(£) e b(7). Finalmente, uti- 
lizando a integral completa obtida para a equação de Hamilton-Jacobi, reduza a quadra- 


turas a solução das equações de movimento do elétron. 
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9.3. Considere o problema de Kepler no plano, isto é, uma partícula de massa m no 
potencial V(r) = k/r, onde r = yz? +y?. Obtenha a equação de Hamilton-Jacobi em 
termos das variáveis u=r+2,vu=r-—2 e encontre uma integral completa. Determine 


a equação da órbita da partícula em termos das coordenadas (u,v). 


9.4. Uma partícula com energia total positiva move-se ao longo de uma linha reta sob 
a influência do potencial V(x) = Fl|x|, onde F é uma constante positiva. Use variáveis 
de ação-ângulo para encontrar o período do movimento como função da energia. Qual é o 


espectro energético resultante da aplicação das regras de Wilson-Sommerfeld? 


9.5. Seja H(q,p,t) a hamiltoniana de um sistema com n graus de liberdade e suponha 


que © satisfaça a equação diferencial parcial 


OS Os OS 


E hate ti ase ee 
dp; Op, Pv? Pea 


H( 
conhecida como equação de Hamilton-Jacobi na representação p. Que tipo de função 
geradora S deve ser considerada para se chegar a esta equação? Escreva as equações e 
indique o procedimento que permite obter a solução das equações de movimento uma vez 
conhecida uma integral completa S(p,a,t) da equação acima. Aplique esta formulação ao 
problema unidimensional de uma partícula sujeita a uma força constante, cuja hamiltoni- 
ana é H = p*/2m— Fq, e determine o movimento q(t) da partícula. Por que a equação 
de Hamilton-Jacobi na representação p é, em geral, mais difícil de resolver do que na 


representação usual? 


9.6. Uma partícula de carga e move-se no plano (x,y) na presença de um um campo 
magnético constante perpendicular ao plano. (i) Mostre que uma hamiltoniana que des- 


creve este sistema é 


e obtenha a solução x(t), y(t), pr(t), py(t) das equações de movimento pelo método de 


Hamilton-Jacobi. (ii) Mostre que uma hamiltoniana alternativa para este sistema é 


H= (pet $0)" + salta Ea) 


Constate que a equação de Hamilton-Jacobi associada não é separável na forma usual. 
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Isto mostra que a separabilidade da equação de Hamilton-Jacobi depende nao apenas da 
escolha do sistema de coordenadas, mas também do calibre em que ela é escrita. Separe 
as variáveis fazendo W = Kay+a,y+X(x), onde a, é uma constante arbitrariae K é 
uma constante convenientemente escolhida, e resolva as equações de movimento. Compare 


com os resultados obtidos no item (i). 


9.7. Suponha que num problema com um grau de liberdade o potencial dependa linear- 


mente do tempo, de modo que 


2 


Hee Ae 
2m 


onde A é uma constante. Resolva as equações de movimento deste problema pelo método 


de Hamilton-Jacobi. 


9.8. Mostre que a equação de Hamilton-Jacobi (9.2.1) para uma partícula livre unidi- 
mensional é separável na forma de produto, isto é, admite soluções da forma S(q,t) = 
W(q)T(t). Usando esta técnica de separação de variáveis, obtenha uma integral completa 


e, a partir dela, a solução geral da equação de movimento para q(t). 


9.9. Uma partícula de massa m move-se numa linha reta sujeita ao potencial V(x) = 
Vo/cost(x/0), Vo > 0, , £>0. (i) Esboceo gráfico de V versus x para x € (—lr/2, (7/2). 
Para que valores da energia total o movimento é periódico? (ii) Supondo que a energia é 
tal que o movimento é periódico, use o método das variáveis de ação ângulo para obter o 
período de oscilação em função da energia. (iii) Quais são os níveis de energia da partícula 


segunda as regras de quantização de Wilson-Sommerfeld? 


9.10. Uma partícula num plano tem seu movimento descrito pela hamiltoniana 


1 
H = prpy coswt + 5 Pe — py) sen wt . 


(a) Encontre uma integral completa da equação de Hamilton-Jacobi associada. (b) Obtenha 


a solução geral das equações demovimento para z(t) e y(t). 


9.11. O movimento de uma partícula num plano é determinado pela hamiltoniana 


Lp EP p k 


H = i ; 
2x2 +y? v+y 
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onde (x,y) são coordenadas cartesianas e k > 0. (a) Use a equação de Hamilton-Jacobi 
para obter a equação da trajetória da partícula. (b) Prove que a órbita é uma seção cônica 


(elipse, parábola ou hipérbole). 


9.12. Reconsidere a máquina de Atwood oscilante do Problema 1.5 no caso especial 


M = 3m. Mostre que a mudança de variáveis 


p= yra + sen 0/2) , n= yra — sen 0/2) , 
com inversa 
NE z aE n 
r = EE a E 6 = 2tan ( En ) 5 


transforma a Lagrangiana dada no Problema 1.5 em 


2 Dé? 2 Em 
L= mE +nE +7 mg ae 
que da lugar a hamiltoniana 
1 2 eile: 2 4 L 4 
H = Pet Bm + 2mg Sia! : 
8m E + 72 E 4 72 


Mostre que a equação de Hamilton-Jacobi correspondente é separável e encontre uma 


integral completa (Tufillaro 1986). 


9.13. Dê uma demonstração elementar do resultado do Exercício 9.7.1 calculando o 
trabalho realizado pela força externa para variar de dL a distância entre as paredes e 
levando em conta que a variação da energia da partícula deve ser igual ao trabalho realizado 
pela força aplicada. Sugestão: a força externa deve contrabalançar a força média que a 


partícula exerce sobre as paredes em virtude das colisões sucessivas. 


9.14. Uma partícula de massa m l0ve-se no campo gravitacional de duas massas muito 


maiores my e ms que permanecem fixas sobre o eixo z nas posições (0,0, +a). Mostre 
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que a equação de Hamilton-Jacobi deste problema é separável em coordenadas elipsoidais 


(u,v, p) definidas em termos das coordenadas esféricas (r, 0, y) por 


r = asenhv sen u ; r = a cosh v cos u 


e reduza a solução das equações de movimento a quadraturas. 


9.15. Uma partícula com energia total negativa move-se em uma dimensão no potencial 
V = —V/ cosh?(ax), onde a é uma constante positiva. Se Vo varia lentamente com o 


tempo, prove que (Vo + E)/./Vo é um invariante adiabático. 


9.16. Considere o sistema descrito no Problema 2.9 e suponha que o fio seja puxado 
de modo a reduzir lentamente o raio r da circunferência descrita com velocidade v pela 
partícula de massa m2. Prove que o produto vr é um invariante adiabático. Apresente 


também uma demonstração elementar desse resultado, sem recorrer a variáveis de ação. 


Capitulo 10 


TEORIA CLASSICA DE CAMPOS 


That one body may act upon another at a distance through a vacuum, without the 
mediation of any thing else, by and through which their action and force may be 
conveyed from one to hhe other, is to me so great an absurdity, that I believe no 
man who has in philosophical matters a competent faculty of thinking, can ever fall 
into it. 


Isaac Newton 


Sistemas contínuos possuem um número infinito de graus de liberdade e são descritos 
por campos. É fato notável que praticamente todas as teorias de campos de interesse 
físico podem ser descritas pelos formalismos de Lagrange e Hamilton. As interações das 
partículas elementares, constituintes básicos da matéria, são expressas por meios de teorias 
quânticas de campos. Por sua vez, a construção das teorias quânticas das interações 
fundamentais da natureza depende crucialmente da possibilidade de primeiro formulá-las 
como teorias clássicas de campos nas linguagens lagrangiana e hamiltoniana, o que vem a 


ser o objeto do presente capítulo. 


10.1 “Teoria de Campos na Forma Lagrangiana 


Um sistema mecânico com um número finito de graus de liberdade é descrito pelas 
coordenadas generalizadas q(t). O sistema contínuo mais simples é descrito por uma 
coordenada x(t) associada a cada ponto x do espaço, ou seja, o índice discreto k é 
substituído pelo índice contínuo x. Por simplicidade, consideraremos inicialmente cam- 


pos em uma dimensão espacial e, em vez de utilizar a coordenada espacial como subscrito, 
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usaremos a notação tradicional p(x,t). Por exemplo, y(x,t) poderia representar o deslo- 


camento transversal no instante t do ponto x de uma corda vibrante. 


A lagrangiana de um sistema discreto envolve uma soma sobre todos os graus de liber- 
dade, de modo que a lagrangiana de um sistema contínuo deve ser expressa em termos 
da integral espacial de uma função £, chamada de densidade lagrangiana. A densidade 
lagrangiana deve conter um termo cinético, logo deve depender de p(x,t) = dy/ôt. Em 
contraste com a idéia de ação à distância, suporemos que um campo interage somente 
com seu vizinhos infinitesimais, de modo que £ deve depender de y(x,t) e y(x +dz,t). 
Alternativamente, em vez desta última quantidade é melhor usar y'(x,t) = dp/dx. Ad- 
mitindo uma possível dependência explícita em x e t, a ação mais geral para uma teoria 


de campos unidimensional tem a forma 
to x2 Oy dp 
de= at f dene Cao 10.1.1 
ti ti i (v Ox Ot i ) ( ) 
A equação de Lagrange para y decorre do princípio de Hamilton 


t2 x2 
i= at f dxL=0. (10.1.2) 
ty x1 


Como o exemplo da corda vibrante com extremos fixos sugere, a variação do campo deve 


anular-se não apenas nos extremos temporais mas também nos extremos espaciais: 


O02, tı) = dps do) O , ðylzı, t) = dim) = 0: (10.1.3) 


Executando a variação da ação (10.1.1) resulta 


t pm OL. ƏL.. ƏL 
= > 4 ma 10.1.4 
5S pdt [de (580 T ap) (10.1.4) 


Usando 


je) (10.1.5) 


realizando integrações por partes e levando em conta (10.1.3) obtemos 
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> fa fees (35) 


faf d£ 


72 0 /OL 
À “at | de 48 (10.1.6a) 
e, analogamente, 
te OL. OL o (5) 
[ gl = Km “fuf ei 
z2 Ə /OL 
E “at dm GR (10.1.6b) 
Substituindo estes resultados em (10.1.4), o princípio de Hamilton torna-se 
t2 x2 OL oð OL o OL 
— — =0. 10.1. 
T af ate (902/09) > (ages) po? i RRN 


Pelo mesmo argumento utilizado na Seção 2.1, a arbitrariedade de dy implica a validade 


da equação de Lagrange 


a E z 2i a e gas 


dt\d(dy/dt)/ © Ax \O(Oy/Ax 


E Exemplo 10.1.1. Considere uma corda com pontos extremos fixos x =0 e x=. Sea é 
a densidade linear de massa e 7 é a tensão na corda, mostre que a densidade lagrangiana 


L= 50( 2)’ (E) (10.1.9) 


gera a equação de movimento correta para pequenas vibrações transversais da corda. 
Solução. Escrevendo L = 02/2 — 1y'2/2. obtém-se imediatamente 


ðL _ ak dp ƏL L_e L (10.1.10) 
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Figura 10.1.1: Modelo discreto para vibrações transversais de uma corda. 


Levando estes resultados na equação de Lagrange (10.1.8) resulta 


Pp Fy 
que é a conhecida equação de onda unidimensional da corda vibrante. E 


É instrutivo e esclarecedor encarar a corda vibrante como o limite contínuo de um 
sistema discreto. Suponhamos que N massas iguais estejam conectadas por fios de massa 
desprezível, conforme representado na Fig. 10.1.1. Na situação de equilíbrio a tensão 
T nos fios é constante e as massas estão igualmente espaçadas de a. As coordenadas 


generalizadas são os deslocamentos transversais m1,...,N7N com a convenção 


No =N=} , (10.1.12) 


que incorpora a condição de contorno de extremos fixos. A Fig. 10.1.2 e a segunda lei de 


Newton permitem escrever a equação de movimento da 7-ésima partícula na forma 


mi, = T(sin 8 — sin a) ~ T(tan 8 — tan a) , (10.1.13) 


supondo pequenos deslocamentos.! Usando 


1 Justifica-se usar a tensão de equilíbrio r em (10.1.13) porque ela já aparece multiplicada por termos 
de primeira ordem nas quantidades pequenas. 
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Figura 10.1.2: Diagrama de forças sobre a i-ésima partícula do modelo discreto para a 
corda vibrante. 


pre Eh , tan 8 = diana f (10.1.14) 
a a 
a equação (10.1.13) torna-se 
x T 
H esas [mia — m) — (Mi — Mia) J - (10.1.15) 


Estas equações de movimento são geradas pela lagrangiana 


as. ae T 5 
b=), 9 Ik x, zg (ett =N). (10.1.16) 
k=1 k=0 


E Exercício 10.1.1. Notando que na expressão para L somente os termos da soma com 
k=i—1 e k= i contribuem para OL/0n;, mostre que as equações de Lagrange geradas pela 


lagrangiana (10.1.16) são exatamente as Eqs.(10.1.15). E 


Pondo Ax = a, denotando por x a abscissa da i-ésima partícula e fazendo a mudança 


de notação 


m(t) =e plx, t) , Ma (t) Rá m(t) E p(x F Ar, t) no plx, t) , (10.1.17) 
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podemos reescrever a lagrangiana (10.1.16) na forma conveniente 


L= Da - (20) - VAr (e Sa a 3 (10.1.18) 


A passagem ao limite continuo é efetuada fazendo Ax > 0 em — 0 de tal modo que 


m/Ax =o, resultando na lagrangiana 


£ a/Op\2 T/Op,2 
r= a) (55) (10.1.19) 


da qual se identifica imediatamente a densidade lagrangiana (10.1.9). 


No caso de um sistema de N campos em três dimensões espaciais, representados 
coletivamente por Y = (91,...,Yn), as equações de Lagrange resultantes do princípio de 


Hamilton 


dy 
es 4 
63 = f x Lo, É T, Viet) = 0 (10.1.20) 
escrevem-se 
ð OL OL OL 
G — = =S N 10.1.21 
aona) Y (ava) BD ami nae) 


A fim de demonstrar este resultado, consideremos 


OL oL OL 
da Ypa 4 Pa 4 A Voa) bo, 10.1.22 
69 = ; “af À Em pat a5 Seat o) (Ve ) ( ) 


onde as variações dos Ya são mutuamente independentes e anulam-se nos extremos de 
integração temporal e na superfície que limita a região tridimensional V. Usando pa = 


O(d~a)/Ot, uma integração por partes como no caso unidimensional fornece 


a = — [0 at f Ba - (= “ão Da (10.1.23) 


[rales 
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Usando agora ó(V ya) = V (pa) e lançando mão da identidade 


V-(fA)=A-VF+FV-A, (10.1.24) 


podemos efetuar uma integração por partes com a ajuda do teorema da divergência para 
obter 


m at f Pn NV a) 


= O awe” i dt f Ev (ava) es 


Ras “dt | Eey. am , (10.1.25) 


pois as variações Ya anulam-se na superfície 3 que limita a região espacial V . Intro- 
duzindo (10.1.23) e (10.1.25) em (10.1.22), o princípio de Hamilton toma a forma 


So Gp 


aL 
3 Es 10.1.2 
os = f “af E oon, Jj 0, (101.26) 


l CEZA 


donde resultam imediatamente as equações de Lagrange (10.1.21) porque as variações ya 


são independentes e arbitrárias. 


Certas teorias demandam o emprego de campos complexos. Um campo complexo 
equivale a dois campos reais independentes. Equivalentemente, em lugar das partes real 
e imaginária de um campo complexo 1), podemos considerar o próprio campo e seu com- 
plexo conjugado w* como campos independentes. Neste caso, para cada campo complexo 
teremos um par de equações de Lagrange da forma (10.1.21) tomando primeiro Ya = w 


e em seguida Ya = Y*. 
E Exercício 10.1.2. Seja / um campo complexo e considere a densidade lagrangiana 


2 
L = thy — lvy VV. (10.1.27) 


Tomando wy e y* como campos independentes, mostre que as equações de Lagrange correspon- 
dentes são a equação de Schrödinger 
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Op Rê 


ee = 2 .1. 
in Sa p+ V(x, t)y (10.1.28) 


e o seu complexo conjugado. E 


10.2 Teorias de Campos Relativísticas 


As equações de Lagrange (10.1.21) permanecem inalteradas sob uma mudança de 


escala das coordenadas x,t. Em particular, fazendo x° = ct temos 


o OL o OL 
= 10.2.1 
aea = Bad e aT et) 
Suporemos, de ora em diante, que a derivada temporal é sempre em relação a x° = ct, 


de modo que, em termos da notação covariante do Capítulo 6, as equações de Lagrange 


escrevem-se 


0, ak ees (10.2.2) 


onde 


_@ 100 8 8, 78a 
ô, = dan Comi os (5,0°) 


(10.2.3) 


Se, para um dado valor de a, ya for um campo escalar, „pa será um quadrivetor 
covariante. Neste caso, se a lagrangiana” L for uma grandeza escalar, OL/O(Oy~a) será 
um quadrivetor contravariante e o primeiro termo à esquerda na Eq.(10.2.2) será um 
escalar. De modo geral, para que as equações de Lagrange (10.2.2) sejam manifestamente 
covariantes basta exigir que a lagrangiana seja um escalar. A propósito, uma vez que o 
elemento de volume quadridimensional dfx é invariante sob transformações de Lorentz, a 


ação S = [d'x£ também será um escalar se £ for um escalar. 


Como primeiro exemplo de uma teoria de campos relativística, consideremos a teoria 


de um méson escalar cuja lagrangiana é 


2Conscientes do abuso de linguagem, daqui por diante nos referiremos à densidade lagrangiana sim- 
plesmente como lagrangiana, como é usual em teoria de campos. 
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1 m? 
L= 5 PO" — ze (10.2.4) 


onde m é a massa da partícula (em unidades tais que A = c = 1). Esta lagrangiana é 
um escalar sob transformações de Lorentz, já que é é um campo escalar (real). A fim de 
tornar os cálculos mais transparentes, vamos introduzir a notação ¢, = 0,4, em termos 


da qual podemos escrever 


OL ð 1 j 1 v 1 j 1 5 
JO 50, (59 buds) = 598d + 596,08 = [gta + gu] = 6". (10.2.5) 


Levando este resultado em (10.2.2) resulta a equação de Klein-Gordon 


(0+mo=0, (10.2.6) 


onde usamos o operador d' Alembertiano definido pela Eq.(6.4.12). Na teoria quântica dos 


campos esta equação descreve mésons escalares, que são partículas da massa m sem spin. 
Outro exemplo importante é o do campo eletromagnético livre (no vácuo). Como 


campos independentes tomemos as componentes do quadripotencial A, . Mostremos que 


a lagrangiana® 


fes pn, (10.2.7) 


com 


Fu — 9,A, -ð A (10.2.8) 


dá as equações de campo corretas. Agora Ya = Ay e a é um índice de quadrivetor. Para 


facilitar o cálculo definamos o campo tensorial auxiliar 


ASO ay: (10.2.9) 


3A lagrangiana (10.2.7) é correta no sistema de unidades de Heaviside-Lorentz (Jackson 1975), o qual 
costuma ser usado na teoria quântica de campos. No sistema gaussiano, o fator 1/4 deve ser substituído 
por 1/167. 
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Tendo em vista que 0£/0A, = 0, as equações de Lagrange reduzem-se a 


OL 
pa 
De (10.2.7) deduz-se 
OL 1 /OF ey ney, OEP- TOF gy «gs 
i T Fag) = 2DA jo l 


Por outro lado, de Fg, = Ag, — Ayg resulta imediatamente 


oF é Š 
a. = 6505 — 6G . 
Conseqiientemente, 
OL 1 1 
— _-(SH Sa _ Su sa) BY — (pulo pov) — mau 
DA 5 (58 ô% — ÒE ôg) F 5E FROM Ves EP 


e as equações de campo escrevem-se 


F” =0 , 
que são idênticas a (6.5.13) com Jº =0. 


E Exercício 10.2.1. Mostre que a lagrangiana 


1 
L= FFF — JA, 
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(10.2.10) 


(10.2.11) 


(10.2.12) 


(10.2.13) 


(10.2.14) 


(10.2.15) 


fornece as equações de movimento corretas para o campo eletromagnético na presença de uma 


quadricorrente externa (em unidades de Heaviside-Lorentz). 
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10.3 Derivadas Funcionais 


Na teoria clássica de campos somos levados naturalmente a lidar com funcionais, e a 
noção de derivada funcional desempenha um papel proeminente. Seja x = (2,...,2n) 
um ponto de R” e f(x) uma função suficientemente diferenciável de n variáveis reais. 
Um funcional F é uma regra que associa um número real F[f] a cada função f. A 
derivada funcional de F em relação a f no ponto x, denotada por óF/ô f(x), é definida 


por 


d ' 5F 
(ZEU +e) = Í; drole) pro) - (10.3.1) 


A partir desta definição implícita prova-se facilmente que a diferenciação funcional satisfaz 


ô OF, OF» 
——~ (oF; F>) = i : 10.3.2 
cr) + OF) = gray + Cpo) ae 
onde cı e c2 são constantes, e obedece à regra de derivada de um produto: 
ô OF, OF» 
——(F Fh) = + F : 10.3. 
Fa) = sr) Pirro) D 


Prova-se, ainda, que se ® = &(F) é uma função diferenciável do funcional F vale a regra 


da cadeia da diferenciação funcional na forma 


ôP db ôF 
= ; 10.3.4 
ila) dF SFG) ee 
Vejamos alguns exemplos simples de cálculo de derivadas funcionais. Se 
F|f] = dx f(x) , (10.3.5) 


R” 


entao 
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(10.3.7) 


Fif+eo]=Fifl+ef, drole) = (EFI + eo) = if d"vo(x) , (10.3.6) 
donde 
OF 
io 


E Exercício 10.3.1. Mostre que 


ô i o 
Teo lp? y f(y)? =2 f(x) . 


Usando este resultado e (10.3.4), prove que a equação diferencial funcional 


admite como solução 
F|f] =C expf-3 fae sa)?} 
2 JR , 
onde C é uma constante arbitrária (Rosen 1969). 


Outro exemplo interessante é fornecido por 


Fif|= | zdy K(e,y) fle) f) | 


(10.3.8) 


(10.3.9) 


(10.3.11) 


onde K(x,y) é uma função conhecida. Temos, agora, omitindo o termo de segunda ordem 


em €, que não contribui para a derivada funcional, 


Flf+ eo] = F|f] + c | d'zd'yK(a, y)o(x) f(y) + c | d'zd'yK(e, y)f(x)o(y) , (10.3.12) 


donde 
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(£r [f +eo]) oo [Mee 'yK(e, y)o(x) f(y) + | @ed"yK(e,y)f@)oly) . (10.3.13) 


Comparando esta equação com (10.3.1) resulta 


= f vik (2,9) + K(y,2)] f(y) - (10.3.14) 


Funcionais dependentes de parâmetros ocorrem com frequência. Um exemplo de in- 


teresse é o funcional F, definido por 


F,[f] = f dx K(a,2') f(a!) . (10.3.15) 


Um cálculo simples e direto mostra que a derivada funcional de F, é 


= K(x,y) . (10.3.16) 


Com o emprego da “função” delta de Dirac também se pode encarar f(x) como um 
funcional da forma (10.3.15): 


= dx" o(a — 2’) f(a’) . (10.3.17) 
R” 
Temos, de acordo com (10.3.16), 
ò f(z) 
= (x — , 10.3.18 
aay =se) (10.3.18) 
Se Flf,..., fn] é um funcional de N variáveis, a derivada funcional F /ô f(x) é 


definida por uma extensão natural de (10.3.1), a saber: 


E Fifi teoi,...,fN + eon]) au =f dx E opla (10.3.19) 


de 
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Comparando esta definição de derivada funcional com a noção de variação de um funcional 


introduzida na Seção 2.2, podemos escrever 


ôF = / d" x 2 Fay ia (10.3.20) 


Em outras palavras, a derivada funcional de F é determinada pelo termo de primeira 
ordem da expansão de F|f + 6f] em potências de df. A Eq.(10.3.18) adquire a forma 


generalizada 


ô fila) 


36) TO (x —y) . (10.3.21) 


Inspecionando (10.1.26) e comparando com (10.3.20) somos conduzidos a 


ôS OL ð; OL 
TOA 


o x OL 
PaT) E Opalr) O SOpalx) 


Tenn (10.3.22) 
(trato) 
onde x = (x,t). Portanto, em termos de derivadas funcionais da ação, as equações de 


Lagrange podem ser escritas na forma compacta 


6S 
dPa(L) 


ie (10.3.23) 


As derivadas funcionais são particularmente úteis na formulação hamiltoniana das teorias 


de campos, que passamos a discutir. 


10.4 “Teoria de Campos na Forma Hamiltoniana 


Vamos definir o momento canonicamente conjugado a ya(sx), denotado por mº(x), 


da mesma forma que na dinâmica de partículas: 


OL 


ER ando 


(10.4.1) 
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Suponhamos que as Eqs.(10.4.1) sejam solúveis para os Ya. Neste caso, a densidade 
hamiltoniana H definida por 
H=51ºGa-L (10.4.2) 


pode ser expressa em termos de 7º , ya e seus gradientes. A hamiltoniana 


Hlva, 7°] = I Px Hlpalt), Vealx), n(x), VT (2) (10.4.3) 


é um funcional dos campos e de seus momentos conjugados.* 


A ação na forma hamiltoniana escreve-se 


S= [ae oa T“ Pa — Ha Vea TS, Vn) (10.4.4) 


e as equações de Hamilton decorrem do princípio variacional 6S = 0. Variando inde- 
pendentemente os campos e seus momentos canonicamente conjugados, o princípio de 


Hamilton toma a forma 


55 = fato da iatón da Fe beam qa ? T oit 


a H OH OH OH E 
= [t 5f (-+ ds | Vay ya) (Ga — EV. )on }=0 : 
(10.4.5) 


onde, como de hábito, uma integração por partes foi feita e termos de fronteira foram 


descartados. Igualando a zero os coeficientes de pa e ôT% obtemos 


OH OH 
=>" Ve. 10.4. 
Pe = ama e AV nº) | bo) 
OH OH 
r= — EV. 10.4.6b 
PPa OV qa) l ) 


“Em todas as teorias de interesse físico fundamental, H não depende dos gradientes dos 7º. 
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que são as equações de campo na forma hamiltoniana. Usando (10.3.22) com H no lugar 
de S e notando que H não depende das derivadas temporais dos ya e 7º, podemos 


escrever as equações de Hamilton (10.4.6) na forma condensada 


ôH saraa OH 
= rn) T(x) = TAA (10.4.7) 


Palaz) 


cuja semelhança com as equações de Hamilton para sistemas discretos é notável. 


E Exemplo 10.4.1. Obtenha a densidade hamiltoniana e as equações de Hamilton para o 
campo de Klein-Gordon descrito pela lagrangiana (10.2.4). 


Solução. Escrevendo a lagrangiana (10.2.4) na forma 


seno dl m o 
L= 5 eo — FÉ Vo- e (10.4.8) 
resulta 
OL 
T(x) = — = (x) . 10.4.9 
(2) = 3566) = 9) (10.4.9) 
Portanto, 
Poti mM? o 


e as equações de Hamilton (10.4.6) adquirem a forma 
bx) =n(z) , læ) = Vele) — m2 g(a) . (10.4.11) 
E facil verificar que estas equações são equivalentes à equação de Klein-Gordon (10.2.6). E 


Na formulação hamiltoniana uma variável dinâmica X é um funcional dos Ya e T“ 


da forma 


Xl, 7] = [Px X (Ga, Vea To, 01%; x,t) E (10.4.12) 


onde a integração estende-se por todo o espaço e supomos que pala) e T%(x) anulam-se 
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no infinito espacial. Note que as variáveis dinâmicas sao geralmente funções do tempo. O 


parêntese de Poisson de duas variáveis dinâmicas é definido por 


ee ae), ee) 0X 0Y 
{X,Y} = [a 72, (po) ira)  dx%(z) Scala) 


a=1 


(10.4.13) 


Com o intuito de determinar a equação de movimento de uma variável dinâmica arbitrária, 


note que a variação de X num intervalo de tempo ôt é dada por 


OX OX OX 
; i — 10.4.14 
TAOLA A rot) (10.4.14) 


ox = | Pa Si 


uma vez que d~q = Padt e n“ = t%őt. Usando as equações de Hamilton (10.4.7) e a 


definição de parêntese de Poisson (10.4.13) resulta 


dX Ox 


— ={X,H}+ — 10.4.1 
onde, por definição, 
OX OX 
— = | Pr. 10.4.16 
at / “o l ) 


Uma das principais virtudes da notação funcional é tornar a equação de movimento para 
uma variável dinâmica na teoria de campos formalmente idêntica à Eq. (8.4.3) para sistemas 


discretos. 


Considere os funcionais 


X, [vo] = palx,t) = / dx! 5(x — x!) pal, t) (10.4.17) 


Yam] = 1°(x,t) = / Ba! 5(x — x’) nÊ (x, t) . (10.4.18) 
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Com o emprego de (10.3.21) obtém-se 


fé» ! Dica x) 69 5(y — x") = 68 6(x —y) . (10.4.19) 
Este resultado costuma ser expresso na forma 


{pa(x,t), my, t)} = 08 6(x—y) , (10.4.20) 


que é a versão continua de {q;,p;} = ĝi; . Analogamente, é imediato que 


{yalx,t), ol, =0 0 tro, n yt} = (10.4.21) 


Os parénteses de Poisson fundamentais (10.4.20) e (10.4.21) servem de ponto de partida 
para a quantização canônica de uma teoria clássica de campos. O parêntese de Poisson 
dos campos clássicos multiplicado por zh é substituído pelo comutador dos operadores de 
campo correspondentes, no caso de campos bosônicos, ou pelo anticomutador, no caso de 


campos fermiônicos. 


10.5 Simetrias da Ação e Teorema de Noether 


A versão contínua do teorema de Noether estabelece a conexão genérica entre sime- 
trias e leis de conservação na teoria clássica de campos. Consideremos a transformação 


infinitesimal 


ch — r" =r" + Ar , (10.5.1) 


Palt) — P'alT) = palz) + Ava(zr) . (10.5.2) 
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A variação A difere da variação usual ô porque leva em conta a mudança do campo 
em consequência da alteração tanto de sua forma funcional quanto de seu argumento. A 


variação provocada apenas pela mudança de forma é definida por 


palT) = Mala) — pala), (10.5.3) 


de modo que 


Apals) = pala”) — pal) + palx”) — palx) = dal”) + OnPa(x) Art, (10.5.4) 


onde estamos empregando a convenção de soma sobre índices repetidos e a notação covari- 
ante do Capítulo 6. Desprezando termos de segunda ordem nas variações infinitesimais, a 
Eq.(10.5.4) se reduz a 


Apalx) = palt) + Pa AT" , (10.5.5) 


onde introduzimos a notação abreviada a; para as derivadas dos campos: 


Polt) = Ou Pot) . (10.5.6) 


E importante destacar que as derivadas O, comutam com a operação 6 mas não comutam 


com a operação A. Aplicando a Eq.(10.5.5) a Ya; resulta 


Ava;a(&) = bPa;a() + Pagu AT" . (10.5.7) 


A variação da ação é definida por 


AS = je da Co! ala, O ao(s), 2") = [ ate £(vala), pogla) 2) l (10.5.8) 
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A lagrangiana variada é dada por 


OL OL 
= L£(val2), Paa(x), 2) + =—Avo 4 Mog — Na? 
E(polt), Pasa(t), 2) + 5° Av Deus Pt p 
OL ðL dL dL 
ae ad ose + — Az" = = At 10.5. 
L TA A et 7 At LM OL anne (10.5.9) 


onde usamos (10.5.5) e (10.5.7), e d/dx” denota o que é lícito chamar de “derivada parcial 


total” em relação à coordenada x”, 


dl OL Opa, 
det Opa OL" ` Ipag OL! 


ER E (10.5.10) 


que leva em conta a dependência explícita e a dependência por intermédio dos campos. 


Por outro lado, temos 


yaa: (10.5.11) 


E Exercício 10.5.1. Inspecionando a matriz jacobiana da transformação (10.5.1), usando o 
desenvolvimento de um determinante por linhas ou colunas e desprezando infinitésimos de ordem 


superior à primeira, demonstre (10.5.11). H 


Levando (10.5.9) e (10.5.11) em (10.5.8), e desprezando termos de ordem superior à 


primeira nas variações, resulta 


as = f d'o[6£ Eq pa = f dte [564+ (cd0")] (10519) 


“dar Ox” da! 


Usando as equações de movimento 
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OL d OL 
OPa = eb Baa (10.5.13) 
obtemos 
oL OL d , aL aL ð É Bh 
ôL = aoe i Bpap roe E FE Oa Pa Ipag 58 | Ya) = en eae Spa) , 
(10.5.14) 


onde, para obter a última igualdade, o índice mudo de soma ĝ foi trocado por u. Intro- 


duzindo (10.5.14) em (10.5.12), a condição de invariância da ação torna-se 


o 


AS = | d LAT" $= 10.5.1 
S Eo Fan vate | 0, (10.5.15) 


que implica uma lei de conservação local na forma covariante (6.5.6). De fato, a natureza 
arbitrária do domínio de integração exige que o integrando na Eq.(10.5.15) seja zero, o que 
equivale à equação da continuidade para a quadricorrente definida pela expressão entre 


chaves . 


E mais conveniente, no entanto, exprimir a lei de conservação da quadricorrente em 
termos dos parâmetros infinitesimais que caracterizam a transformação. Suponha que 


a transformação (10.5.1-2) seja especificada em termos de R parâmetros infinitesimais 


independentes «,...,er na forma 
R R 
Ah ADE. | Roy OU Es (10.5.16) 
r=1 r=1 


Os índices a e r dos campos e dos parâmetros da transformação podem ou não ter caráter 
tensorial, e persistiremos convencionando que índices repetidos de qualquer natureza in- 


dicam uma soma. Substituindo (10.5.16) em (10.5.5) resultam 


Agt = X Oe, , Dip (vO — Pan X” O) Er, (10.5.17) 


que introduzidas em (10.5.15) conduzem a 
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Ag = - f dze 0,0" =0 , (10.5.18) 
onde 


o oL 
OPasy 


or) — 


ENO Gay XO EON, (10.5.19) 


Como a região de integração e os parâmetros e, são arbitrários, de (10.5.18) deduzem-se 


as R leis de conservação local” 


ðO 2 r=1,..., R. (10.5.20) 


Fazendo O0) = (00), 8/7) podemos escrever (10.5.20) na forma usual 


HOEM+V-0M =0, (10.5.21) 


donde 


F PrO ai Bax O° = -f Brv 0” = -4 o.da, (10.5.22) 
dx? Jv V V 5 


onde 3 é a superfície bidimensional que limita o volume V e usamos o teorema da 
divergência. Se a região de integração V engloba todo o espaço tridimensional e os 
campos tendem a oero com suficiente rapidez no infinito, a integral de superfície é nula e 


as integrais 


cO = [se (10.5.23) 


sao quantidades conservadas, pois nao dependem do tempo. Fica, assim, demonstrado que 


“Não havendo mais risco de ambigiiidade, a partir da Eq.(10.5.18) passamos a denotar pelo símbolo 
O, a derivada parcial total em relação a a”. 
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a cada transformação infinitesimal R-paramétrica das coordenadas e campos que deixa 
a ação invariante correspondem R quantidades conservadas C™ dadas por (10.5.23), 


conhecidas como cargas de Noether. 


Como primeiro exemplo importante, considere a “translação” no espaço-tempo 


r" =e, (10.5.24) 


que não modifica os campos, isto é, Aya = 0. Como o jacobiano desta transformação é 
1, as Eqs. (10.5.8) e (10.5.9) mostram que a ação é invariante desde que a lagrangiana não 
dependa explicitamento das coordenadas do espaço-tempo. O índice r dos parâmetros da 


transformação tem natureza quadrivetorial e, de acordo com (10.5.16), temos 


X =g? o pf=0. (10.5.25) 


Substituindo estas expressões em (10.5.19) obtemos o tensor de energia-momento 


OL OL dy 
(af ag g” — Lg” = EG, 10.5.26 
Po;y Hn i Pau OLy E l ) 
As cargas de Noether conservadas compõem o quadrivetor 
P= pon TY (10.5.27) 


A componente zero deste quadrivetor é a integral da densidade hamiltoniana, ou seja, é a 
energia. Considerações de covariância — e o fato de a conservação do momento linear estar 
associada à invariância sob translações espaciais — estabelecem que P” é o quadrimomento 


ou quadrivetor de energia-momento, daí chamar-se TH” de tensor de energia-momento. 


EH Exercício 10.5.1. Mostre que o tensor de energia-momento do campo escalar descrito pela 
lagrangiana (10.2.4) é 


1 
TH” = 0y "y — = (day d%p — m? ) gt” (10.5.28) 


2 


e obtenha a expressão para o momento linear (conservado) do campo. E 
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Considere, agora, um campo escalar complexo descrito pela lagrangiana 


L= 0,0" 0.9 —m ery , (10.5.29) 


a qual é obviamente invariante sob a transformação uniparamétrica 


Sen. vo eo ts (10.5.30) 


onde À é um número real arbitrário. Esta transformação é conhecida como transformação 
de calibre global ou transformação de calibre de primeira espécie, e sua versão infinitesimal 


com À = € escreve-se 


Ap=iep , Ap" =—iey" , (10.5.31) 


donde 


O MSG i SS, (10.5.32) 


com Yi = Y, Y2 = y* eo indice r assumindo apenas o valor r = 1. Como nao ha 
mudança nas coordenadas, a invariância da lagrangiana implica a invariância da ação. A 


corrente de Noether (10.5.19) toma a forma 


OL OL 
Ju = — Uv! — Pi = -i(y* Xp — ype), 10.5.33 
da a T (yp op — pay") ( ) 
e a carga de Noether conservada é 
Q=if delo- oy") (10.5.34) 


Note que nao ha densidade de corrente associada a um campo escalar real, de modo que 


campos escalares complexos são necessários para descrever partículas carregadas sem spin. 


402 CAPiTULO 10. TEORIA CLASSICA DE CAMPOS 


EH Exercício 10.5.2. Encontre a corrente de Noether e a carga de Noether conservada decor- 
rentes da invariância da lagrangiana (10.1.27) do campo de Schrédinger sob uma transformação 


de calibre de primeira espécie. Interprete o resultado. E 


10.6 Campos Vinculados 


Se as Eqs.(10.4.1) não forem mutuamente independentes, elas não podem ser resolvidas 
para as velocidades ýa em termos dos momentos 7º e aparecem vínculos, isto é, relações 
de dependência entre os campos e seus momentos conjugados. Com adaptações até certo 
ponto óbvias, o formalismo desenvolvido na Seção 8.8 estende-se naturalmente às teorias 


de campos. 


Consideremos, à guisa de ilustração, a lagrangiana 


2 
L=ihy*d — t yy Vy" (10.6.1) 


que, conforme o Exercício 10.1.2, descreve o campo de Schrödinger livre. Tomando y% e 


w* como campos independentes, os momentos conjugados correspondentes são 


m()=— =ihy* (2) , mhe) = ———— =0 . (10.6.2) 


A hamiltoniana é dada por 


2 


H=rý +m ý — L= h Gy- Vy . (10.6.3) 
2m 


O parêntese de Poisson é definido por 


ae) ae a a a? 
Conan TOO RIG) bran) Br) 


°Este exemplo é instrutivo porque exibe as principais características do campo de Dirac, que descreve 
p porq p P P , 
partículas de spin 1/2, sem as complicações algébricas inerentes a um campo com quatro componentes. 
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e os parénteses de Poisson fundamentais diferentes de zero sao 


WE thry r= ay) , W(x bt), mly, DI =dx—-y) . (10.6.5) 


As velocidades não aparecem em (10.6.2), de modo que a teoria possui os vínculos primários 


Oi(z) = n(x) —the* (4) x0 , bo(a) = a, (2) 20 . (10.6.6) 


Por analogia com a Eq.(8.8.6), na presença de vínculos as equações de movimento são 


geradas pela hamiltoniana total 


Hr=H+ [ee [A1(2)1(@) + A2(x)da(x)] = [ee { H + A(x) b1(x) + A2(x)d2(z) } 


= fel E VV + Ax (x) [a (x) — iñy* (x)| + As(x)ma(x) } . (10.6.7) 


2m 
De (10.6.5) deduz-se 


{41 (x,t), daly, t)} = —iñ ty (x,t), m(y,t)} = —iħô(x — y) , (10.6.8) 


de modo que a matriz formada pelos parênteses de Poisson dos vínculos tem elementos 


{or(x, t), PY, t)} = —th Ers O(x = y) > (10.6.9) 


onde 
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E = (es) = E ; ; (10.6.10) 


A matriz (10.6.9) tem índices discretos e indices contínuos e, por analogia com (8.8.16), 


sua inversa, caso exista, tem elementos C,s(x,y) definidos por 


[Pe Cole) {6)(2,1), 69,0) = rsd — 9) . (10.6.11) 


Esta definição justifica-se porque, no que se refere aos índices contínuos, os elementos 


da matriz identidade são 6(x — y). Notando que e? = —T, verifica-se facilmente que 


(10.6.11) é satisfeita por 


1 
Crs (x,y) = a Erg O(X —Y) . (10.6.12) 


A existéncia da inversa de (10.6.9) estabelece que os vinculos sao de segunda classe. 


Introduzindo os parénteses de Dirac 


{XY YF ={X,Y} -5 [Prd y{X, oH }Cro( yyt), Y} (10.6.13) 


ou, explicitamente, 


{XY} = {X,Y} - 3 f PeX 6166, tHo), Y) = {X da, Holt 73] à 
(10.6.14) 


os vínculos (10.6.6) podem ser tomados como equações fortes e a hamiltoniana total 


(10.6.7) reduz-se à hamiltoniana canônica 


3 h? * 
H = fa x—Vw- Vy" . (10.6.15) 
2m 


Os momentos canônicos são eliminados da teoria por intermédio das equações de vínculo 


(10.6.6) e os parênteses de Dirac fundamentais são 
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{W(x, t) Ply, tF = tu" (x, t), wy, t)} =0, (10.6.16a) 
(650, 00,0) = ziy) (10.6.16b) 
E Exercício 10.6.1. Usando (10.6.14), verifique as equações (10.6.16). E 


De acordo com as regras de quantizacao de sistemas com vínculos de segunda classe, de- 
vemos substituir os parêntese de Dirac por ih vezes o comutador (para campos bosônicos). 


Assim, o comutador fundamental dos operadores de campo WV e ŲỌt escreve-se 


[W(x, t), Îi (y, t)] = d(x—y) , (10.6.17) 


onde Wt é o adjunto (conjugado hermitiano) de WU. É o comutador (10.6.17) que, no 
caso bosônico, serve de base à chamada segunda quantização da mecânica quântica não- 
relativística (Schiff 1968). A descrição de férmions requer a substituição do comutador 


pelo anticomutador em (10.6.17). 


O campo eletromagnético livre é outro sistema em cuja formulação hamiltoniana apare- 
cem vínculos. Da Equação (10.2.13), com u = 0, deduz-se que os momentos canônicos 


são 


TER. (10.6.18) 


ou, explicitamente, 


pera eos LS Ff (10.6.19) 


onde E’, i = 1,2,3, são as componentes cartesianas do campo elétrico. Há, portanto, um 


vínculo primário 


dO. (10.6.20) 
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Um cálculo direto mostra que a hamiltoniana canônica toma a forma 


H= ILAE N iF Fig + TOA). (10.6.21) 


Com o emprego dos parénteses de Poisson fundamentais 


(Aube t), n” (y,t)} =ô; d(x —y) , (10.6.22) 


a condição de consistência 7° ~ 0 dá lugar ao vínculo secundário 


Q2 = -ðm x 0 . (10.6.23) 


Este vínculo não é outra coisa senão V- E = 0, daí ser conhecido como vínculo da lei de 
Gauss. Nao há outros vínculos porque q» tem parênteses de Poisson nulos tanto com H 


quanto com @¢,. 


E Exercício 10.6.2. Usando os parênteses de Poisson fundamentais, mostre que {¢2(x, t), H} = 
Oe {1 (x, t), da(y, t)} =0. Sugestão: tô; n(x, t), X} = 0; {a (x; t), X} 3 E 


A hamiltoniana total é 


H= JEZIE mr + SPU, — Ap ði Tt + Mó) , (10.6.24) 


tendo sido realizada uma integração por partes com o abandono de um termo de superfície 
que não afeta as equações de movimento. Os vínculos dj e ə sao de primeira classe e 
a dinâmica envolve funções arbitrárias, como Ag, refletindo a invariância da teoria sob 
transformações de calibre. A eliminação das funções arbitrárias requer a fixação do calibre. 
Deve-se notar que Ag desempenha o papel de um multiplicador de Lagrange para a lei 
de Gauss, de modo que as variáveis canônicas são as componentes espaciais do potencial 
vetor e seus momentos conjugados. Outros aspectos e detalhes adicionais do tratamento 
hamiltoniano da eletrodinâmica de Maxwell são deixados para os tratados especializados 
(Dirac 1964; Henneaux & Teitelboim 1992). 
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PROBLEMAS 


10.1. Prove que duas densidades lagrangianas que só diferem por uma quadridivergéncia 


AP (pa, £) geram as mesmas equações de movimento. 


10.2. Diversos autores preferem a seguinte definição direta de derivada funcional: 


OF. Fif(z) +€d(z—y)] — FIf(@)] 
éf(y) <0 € j 


Prove que esta definição é equivalente à adotada na Secão 10.3. 


10.3. Dada a série de potências funcional 


1 
Z|f] = Ko + pan Ky (21) f(z) + 5 fan d” x2 K2(21, £2) f (x1) f (x2) 
1 
fa J d"x1 d’ To d’ x3 K3(21, T2, T3) f(z) f (x2) f (a3) +... 5 
onde K,(x1,...,%n) é simétrica sob permutações de seus argumentos, prove que 


ðZ 
Of (21) +++ Öf (En) lj=0 


TG ADR ae 5g 


Esta formula é de grande utilidade na teoria quantica de campos. 


10.4. O tensor corrente de momento angular (orbital) M°®7 é definido por 


MLI! = TL x — T rÊ ; 


onde T°? éo tensor de energia-momento. (i) O tensor momento angular LEY = f M° dx 


será conservado se 


aM = 0 


Prove que esta última equação é satisfeita se e somente se o tensor de energia-momento 


é simétrico, isto é, T°? = Pê. (ii) Outra razão física para se exigir a simetria do tensor 
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de energia-momento é que ele atua como fonte do campo gravitacional nas equações de 
Einstein, as quais exigem que as fontes da gravitação sejam representadas por tensores 
simétricos. Caso o tensor de energia-momento canônico (10.5.26) não seja simétrico, pode- 
se provar (Barut 1980; Soper 1976) que é sempre possível simetrizá-lo pela adição de 
uma quadridivergência ô yò” onde Yò” é um tensor anti-simétrico nos dois primeiros 
índices A, u. Prove que se 9,7” = 0, também é verdade que 0,0” = 0 com 0” = 
Te dy”. Sugestão: vide item (ii) do Problema 6.6. (iii) Desde que Yò” se anule com 
suficiente rapidez no infinito, prove que as quantidades físicas conservadas correspondentes 
a O” e TH” têm o mesmo valor, o que justifica tomar 0”” como o tensor de energia- 


momento físico. 


10.5. (i) Mostre que, de acordo com (10.5.26), o tensor de energia-momento canônico do 


campo eletromagnético livre é 


1 
PES Aa g” F” Fog . 


Note que este tensor não é simétrico. Outra objeção física a este tensor é que ele não 
é invariante sob transformações de calibre. (ii) Substituindo 0”A, = 9ºA, + F%, na 
expressão de TH” e usando as equações da Maxwell para o campo eletromagnético livre, 


mostre que o tensor 


1 
OM = FFY, + 7 gM EP Fog 


é simétrico, invariante sob transformações de calibre e só difere de TH” por um termo 
da forma descrita no item (ii) do problema anterior. Exceto pelo fato de estar expresso 
em unidades de Heaviside-Lorentz, O!” coincide com o tensor de energia-momento intro- 
duzido no Problema 6.18. 


10.6. A lagrangiana de um campo escalar real o em uma dimensão espacial é 


1 A2 
L= 5 Oa Oyo — E (a =o), 


onde A e a são constantes positivas. (i) Obtenha a equação de movimento satisfeita 
por o. (ii) Mostre que uma solução estática para o é o(x) = a tanh[aà(x — €)/2], onde 


É é uma constante de integração arbitrária. Mostre que esta solução tem energia finita 
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(calcule o seu valor) e conecta duas configurações de campo distintas com energia zero 
para x — too. Esboce o gráfico da densidade de energia como função da posição e 
confirme tratar-se de uma configuração de campo com energia espacialmente localizada. 
(iii) Devido à invariância relativística da teoria, se fizermos a substituição x — y(x — vt) 
com y = (1—v2)!/2 obteremos uma solução viajante para o campo (usando unidades tais 


que c= 1). Verifique diretamente que 


alt= atanh [S PE d 


2 y1 — v2 


é solução da equação de Lagrange obtida no item (i). (iv) Calcule a energia da onda 
em movimento e compare com o valor encontrado em (ii). (v) Calcule o momento linear 
da onda viajante e interprete o resultado obtido. [Configurações de campo com energia 
finita e localizada que se deslocam sem mudança de forma nem diminuição da velocidade 
são chamadas de ondas solitárias. Essas ondas solitárias, observadas pela primeira vez 
em 1834 por J. Scott Russel, constituem um fenômeno típico de teorias de campos não- 
lineares (Lee 1981). Ondas solitárias que sempre se recompõem após colidirem entre si são 


chamadas de sólitons.] 


10.7. Repita a análise do problema anterior para a lagrangiana 


L= 1 9ud9,6 — Es [1 — cos( VA 6/m)] 
vê a A 


A equação de campo correspondente a esta lagrangiana é conhecida como equação de 
sine-Gordon. Sugestão: as substituições x > mz, t > mt, g > VAd/m tornam a vida 


mais fácil. 


10.8. O sistema formado por um campo escalar carregado em interação com o campo 


eletromagnético é descrito pela lagrangiana 


L = (8d + ieA"4)(0,6" — 16 AB) — SF" Fy | 


(a) Obtenha as equações de Lagrange. (b) Prove que a lagrangiana é invariante sob 
a transformação de calibre local (também conhecida como transformação de calibre de 


segunda espécie) 
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ga dd, ga fdp, Ap > Åu = Au + 3X , 
onde x é uma função arbitrária. (c) Mostre que a Lagrangiana pode ser escrita na forma 


1 
L = OON ae qe Fw _ TAs , 


onde J” é a corrente de Noether conservada em virtude da invariância da ação sob trans- 


formações de calibre globais, isto é, com x constante. 


10.9. Considere uma teoria de campos com tensor energia-momento simétrico, de modo 
que o quadrimomento P” e o tensor momento angular LY” são conservados. Mostre que 


as componentes L% do tensor momento angular podem ser escritas na forma 
Er ms 
onde Pº é a energia total e x’ são as componentes do vetor posição do centro de energia: 


o: BrT pi 


KA 


“e Taro 


Conclua que, para um sistema relativístico, a lei de conservação dLº /dxº = 0 equivale a 


dzi P’ 


dx? Po: 


Interprete este resultado comparando-o com o teorema do centro de massa da mecânica 


newtoniana, expresso pela Eq.(1.1.9). 


Apêndice A 


Notacao Indicial 


Este apêndice discute as regras básicas para a manipulação correta de somas envol- 


vendo quantidades indexadas. 


A soma 


S = Qi taa +... +4N 


pode ser escrita numa forma compacta com o emprego do sinal de somatório: 


(A.1) 


(A.2) 


(A.3) 


(A.A) 


e assim por diante. O indice i na Eq.(A.2), j na Eq.(A.3) ou k na Eq.(A.4) é chamado de 


índice “mudo”, significando que a soma é independente da letra usada para indicá-la. 


Uma soma dupla da forma 


(A.5) 
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significa explicitamente 


o = bi +b12 +... +bin + ba + b22 +... t+ bow +... tbm +Hbno +... +byn . (4.6) 


É claro que 


cao bj = > by = >> bji , (A.T) 
ij=l ji=1 ji=1 
e, ainda, 
N N 
o = 5 by = 5 bia, ; (A.8) 
k,l=1 m;n=1 


et cetera, toda estas somas representando exatamente a mesma quantidade expressa pela 
Eq.(A.6). Combinando as Egs.(A.5) e (A.7) obtemos um resultado útil: 


N 
2 (bi; + bjs) - (A.9) 


x 


Somas triplas, quádruplas, etc, são definidas como generalizações imediatas da Eq.(A.5). 


O sistema de equações 


Yı = Qiu Tı T Q12 T2 +... + an TN; 
Y2 = Q21 Tı T doa Lo T... ENN (4.10) 
Ym = amı Tı + am2 T2 +... +tamntin; 
pode ser reescrito na forma abreviada 
N 
Y=} Mto 1=1,...,M. (A.11) 


Um indice que aparece apenas uma vez em cada termo da soma e que nao indica nenhum 


somatório, como i na Eq.(A.11), é chamado de indice “livre”. Note que 


413 


N 
y=} anti , j=1,...,M (A.12) 
l=1 
ou 
N 
MES andas Se, (A.13) 
m=1 


representam exatamente a mesma coisa que a Eq.(A.11). É claro que o índice livre que 


aparece em cada termo de uma equação deve ser o mesmo. Assim, as equações 


a+b=c;, (4.14) 
N 
Qi + > bij Cj = di (A.15) 
j=1 
fazem sentido, ao passo que 


de modo geral é uma equação desprovida de significado. 


O símbolo delta de Kronecker, denotado por 6;;, é definido por 


199 


jl se i=j 
i= o FTE (A.17) 


A principal propriedade do delta de Kronecker é a seguinte: 


N 
> On a1 = ak ‘i eS Meh al Ys (A.18) 
(= 


Esta propriedade é de demonstração imediata, pois 


N 
5 Onl ai = dum E near Ok k—-1@k—1 + Ok Ok + Ôk k+1đk+1 Eds TE OnNQN à (A.19) 
l=1 


Nesta última equação todos os termos são nulos exceto o termo ôkkak = ak, ficando 


estabelecida a Eq.(A.18). Naturalmente, pelo mesmo argumento, 
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N 


j=l 
a mesma propriedade valendo se houver um número qualquer de índices livres. 


O símbolo de Levi-Civita e;jp é completamente definido por €123 = 1 e pela pro- 
priedade de ser anti-simétrico sob qualquer troca de índices adjacentes. Em outras palavras, 
Eijk = +1 conforme (i,j,k) seja uma permutação par ou ímpar de (1,2,3) e en = 0 
caso haja repetição de índices. Usando notação indicial para as componentes cartesianas 
de vetores, como em a = (a1,45,43), o produto vetorial c = a x b pode ser expresso na 


forma 
3 
Cj = 5 Eijk Qj bk é (4.21) 
jk=1 


Uma identidade útil é 


3 
> Eijk Eklm = Out Ora — Õim Ôj - (4.22) 
k=1 


A demonstração deste último resultado consiste em observações simples. O lado esquerdo 
só é diferente de zero se i = l e j =m, ouse i =m e j = 1, logo pode ser expresso como 
uma combinação linear dos produtos de deltas de Kronecker que aparecem no lado direito 


da identidade. Escolhas de valores particulares para os índices determinam os coeficientes. 


Há certos cuidados que precisam ser tomados durante manipulações algébricas envol- 


vendo a notação indicial. Consideremos, inicialmente, o processo de substituição. Se 


N 
Qi = 5 Uik bk (A.23) 
k=1 
e 
N 
b= VE (A.24) 
k=1 


para substituir em (A.23) os b's dados por (A.24), primeiro mudamos o índice livre em 
(A.24) de i para k e o indice mudo k para outra letra ainda não utilizada, digamos l, de 


modo que 
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N 
br =) Vac. (A.25) 


[=i 


Agora, a substituição de (A.25) em (A.23) fornece 


N 
Qi = 5 Uik Va Cr. (4.26) 


kl=1 


Se a transição de (A.24) para (A.25) com a mudança do índice de soma não tivesse 
sido realizada, a troca de i por k em (A.24) seguida de sua introdução direta em (A.23) 


resultaria em 


N N 
Qi = 5 5 Uik Vek Ck , (A.27) 


que é um resultado flagrantemente incorreto porque exclui termos nao-diagonais, tais como 
Via, V23, que teriam que aparecer. Para a substituição redundar numa equação correta 
é indispensável que os índices de soma em (A.23) e (A.24) sejam distintos, uma vez que 
os respectivos somatórios são mutuamente independentes. A mesma precaução deve ser 


tomada na multiplicação de somatórios. Por exemplo, se 


N 
p= >. a (A.28) 
k=1 
e 
N 
k=1 


N 
pq = pa ak bı . (A.30) 
kl=1 
Insistimos que 
N N 
po arbk = N (aibi +azb2 +... + aby) , (4.31) 


k=1 k=1 
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ou seja, o produto de duas somas só pode ser expresso corretamente como soma dupla 
se forem usados índices mudos distintos para representar os somatórios independentes a 


serem multiplicados, como na Eq.(A.30). 


Finalmente, no que concerne ao processo de fatoração, o procedimento correto é indi- 


cado por meio de um exemplo. Considere a equação 


N 
Se Tij Nj — Ani =0 ; (A.32) 
j=l 


na qual queremos fatorar n;. Com a ajuda do delta de Kronecker escrevemos 


N 
j=l 
que inserida em (A.32) fornece 
N N 
5 Tij Nj — A 5 Oi nj = 0 ‘ (A.34) 
j=l j=l 
ou 
N 


conforme se pretendia. 


Apêndice B 


Funções Homogêneas e Teorema de 
Euler 


Uma função F : R” — R é dita homogênea de grau p se existe um número real p tal 
que 
F(A£1,..., A£m) A DD ea ;, à>0, (B.1) 


onde A é um número real positivo arbitrário. 
E Exemplo B.1. A função F(x,y) = (x4 +2xyº — 5yt)sen(x/y) é homogênea de grau 4, pois 
F(Ax, Ay) = (Atx! + 2Ard3y3 — 5A4y4) sen(Ax/Ay) = AF (x,y). Por sua vez, com A constante, 


a função F(x,y, z) = A/(2?+y?+2?)/? satisfaz F(Ax, Ay, Az) = A/(X?x? + Ay? + 22?) 1/2 = 
At F(x,y, z), logo é homogênea de grau —1. E 


Teorema de Euler. Se F : R” — R é uma função diferenciável e homogênea de 


grau p, então 


—_=onF . B2 
Doa P ( ) 


Inversamente, se F satisfaz (B.2) então F é homogênea de grau p. 


Demonstração. Suponha F homogênea de grau p e defina w = Àz1,... , Um = Alm, 


de modo que 


F(ui,..., Um) = A F(z1,..., £m) (B.3) 
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Diferenciando esta última equação em relação a A, com %14,...,Ym fixos, resulta 
™ OF Our e OF 
Serre Baap e sp. B.A 
Z du ON? 2 é ae 
Fazendo À = 1 em (B.4) deduz-se (B.2), pois agora u = Z1,...,Um = Um. Inversamente, 


suponha que F obedeça à equação diferencial (B.2) e considere a função 


GOA) = AP F(Az1,..., Aa) (B.5) 
com %1,...,Ym fixos. Então, novamente com uy = AX,...,Um = AXm, temos 
dg or m oF 
-Z = Sh 1 F -< Um) +A? — gp = A| —p F menti — =) 
(B.6) 


em virtude de (B.2). Portanto, g(A) = constante. Mas de (B.5) infere-se que g(1) = 
F(x1,...,Zm), de modo que g(A) = g(1) = F(x1,...,Zm), O que prova (B.1) e estabelece 


que F é uma função homogênea de grau p. o 


Apêndice C 


Espacos Vetoriais e Operadores 
Lineares 


Neste apêndice expomos em linhas gerais a teoria das transformações lineares em 
espaços vetoriais de dimensão finita. Supomos que o leitor esteja familiarizado com a 
definição de espaço vetorial e com as noções de dependência linear, base, matriz, traço e 
determinante (Halmos 1974; Hoffmann & Kunze 1971). Desigaremos por F o corpo dos 
números reais ou complexos, que chamaremos genericamente de escalares. Denotaremos os 


escalares por letras latinas, tais como a,b,c, e os vetores por letras gregas, como a, 3,9. 


C.1 Operadores Lineares 


Definição C.1. Seja V um espaço vetorial sobre o corpo F. Um operador linear 
(ou uma transformação linear) A em V é uma regra que faz corresponder a cada vetor 


a de Y um vetor Aa de V de tal maneira que 


A(cia + C23) = c Aa + 48 (C.1) 
para todos os a, em V e todos os escalares c1,c» em F. 


Para um operador linear A é sempre verdade que AO = 0. O operador identidade 
I, definido por Ta = a, é uma transformação linear em V, o mesmo ocorrendo com o 


operador nulo 0, definido por 0a = 0. 
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Dados dois operadores lineares A e B, sua soma S = A+ B é o operador linear 
definido por Sa = Aa + Ba, ao passo que seu produto P = AB é definido por Pa = 
A(Ba). Em geral, o produto de operadores lineares não é comutativo. As propriedades 
algébricas da soma e produto de números reais permanecem válidas para operadores, com 


a exceção notável da comutatividade. 


Definição C.2. Um operador linear A é dito inversível se possui as duas seguintes 


propriedades: 
(a) A cada vetor 8 corresponde pelo menos um vetor a tal que Aa = 5; 
(b) Se a; £ as então Aa; £ Aag. 


Estas propriedades caracterizam A como uma aplicação injetora e sobrejetora, isto é, 


como uma bijeção de V em V. 


Se A é inversível pode-se definir um operador linear 4-!, chamado de inverso de 
A, conforme passamos a descrever. Se 5 é qualquer vetor, podemos, por (a), encontrar 
um vetor a tal que Aa = 5. Além disso, por (b), a é univocamente determinado. 
Por definição, 4718 = a. Para provar que A"! é linear, calculemos A~!(c13, + C22) 
com A 13 = a, e AIB = a2. Da linearidade de A segue-se que A(ciay + co09) = 
13, + C282, de modo que A~1(c1; + cab») = corto = ATA + 2A 1G e AT é 
linear. Da definição de inverso decorre imediatamente que 


AAW AA To. (C2) 


Teorema C.1. Um operador linear A num espaço vetorial de dimensão finita V é 


inversivel se e somente se Aa = 0 implica a = 0. 


Demonstração. Se A é inversível, combinando AO = 0 com a propriedade (b) 
conclui-se que a única solução de Aa = 0 é a = 0. Suponha, agora, que Aa = 0 
implica a = 0. Neste caso a, £ as, isto é, a; — as Æ 0 implica A(a; — a2) # 0, ou 
seja, Aa, # Aas, o que prova (b). Para provar (a), seja {a1,...,@,} uma base de V. 
Se >; ciÃa; = O então A(X; ciai) = O donde, conforme nossa hipótese, S;ca;=0 ea 
independência linear dos a; conduza cı = -+-+ = Cn = 0. Portanto, {Aaqi,..., Aan} é um 


conjunto de vetores linearmente independentes, constituindo, também, uma base de V, e 


qualquer vetor 8 pode ser escrito na forma 3 = X; c;Ãa; = A(X; ciai) = Aa. 
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Verifica-se facilmente que: (i) se A e B são inversíveis o produto AB também é 
inversível e (AB)! = B~'A™!; (ii) se A é inversível e c Z 0, então cA é inversível e 


(CA)! = 4+A7!; (iii) se A é inversível, então A”! também é inversível e (A) I=4A. 


C.2 Representação Matricial de Operadores 


Definição C.3. Seja V um espaço vetorial de dimensão n, seja B = {aj,...,Qn} 
uma base de V e seja A um operador linear em V. Já que qualquer vetor é uma 


combinação linear dos a;, temos 


Aa; => aijai 3 EEE N) E (C.3) 
i=1 


O conjunto (a;;) de nº? escalares é a matriz de A na base (ou sistema de coordenadas) 
B, que denotaremos por [A]. Se for necessário especificar a base sob consideração, es- 


creveremos [A]p. 


Sejam € = Dizia; e n = Yj yia; vetores tais que 7 = AE. Sejam [é] e [n] as 


matrizes-coluna 


Tı yı 
[6] = » I=]: (C.4) 
Tn Yn 
Então ” er 
n= AE = X z;Ãa;=5 > traga; , (C.5) 
j=l j=1 i=1 
donde n 
Yi = 5 Qijtj , (C.6) 
j=1 
ou, em linguagem matricial, 
In] = [A] Ig] (C.7) 


E para garantir a validade desta equação que se faz a escolha de índices aparentemente 


perversa na Eq.(C.3). As operações algébricas entre operadores lineares transferem-se 
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inalteradas para as matrizes correspondentes. Por exemplo, fica como um exercício para o 
leitor a comprovação de que se C = AB então |C] = [A] |B]. Em particular, se S é um 
operador inversível, de SS! = SIS = I segue-se que [S][S~!] = [S71] [S] =I, onde I 
é a matriz identidade, e, consequentemente, [S~'] = [S]~!. Um operador linear é inversível 
se e somente se sua matriz associada é regular ou não-singular, isto é, tem determinante 
diferente de zero em alguma base (e, portanto, em todas as bases). Pode-se demonstrar 
(Hoffmann & Kunze 1971) que os elementos da inversa de uma matriz não-singular M 


são dados por 


i+; det M Gli) 


(M Da = (-1) aa 


(C.8) 


onde M(ilj) é a matriz que se obtém apagando a i-ésima linha e a j-ésima coluna de 
M. 


De que forma a matriz associada a um operador linear A é afetada por uma mudança 
de base? Para responder a esta pergunta, sejam ¥ = {&,...,E,} e V={m,..., Nn} duas 
bases de V e considere o operador linear de mudança de base S definido por SE; = Mi, 


ou, mais explicitamente, 


S (X qti £i) = ti Mi - (C.9) 


O operador S é claramente inversível, pois S(>;,x;6&;) = 0 equivale a 5, x;m; = 0, que 


implica xı =... = £n =0. Sejam [Aly = (a;;), [Aly = (by) e [Sly = (sij). Podemos 
escrever 

A; = Du ajé; (C.10) 
e 

Anj = bm - (C.11) 
Portanto, 


Anj = ASE; = A(X sei€e) =D, Sri Abe = J sri (9 inks) = DO irski): » (C12) 
k k k i k 


i 
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ao mesmo tempo que 


Any = X bgt = > bag SEx =D big DY, sui) = DIODE Sunday) - 
k k k i k 


i 


Comparando (C.12) com (C.13) vemos que 
D QikSkj = 5 Sikbkj ) 
k k 
isto é, 


[Ala [Sle = [S]xlAly . 


A forma mais usual de escrever esta equação é 
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(C.13) 


(C.14) 


(C.15) 


(C.16) 


Duas matrizes M e N são ditas similares se estão relacionadas por uma transformação 


de similaridade, isto é, se existe uma matriz inversivel P tal que M = PINP. A 


Eq.(C.16) mostra que, sob uma mudança de base, a matriz associada a um operador linear 
sofre uma transformação de similaridade. Como tr(M N) = tr(N M) e det (M N) = 


(det M)(det N), verifica-se imediatamente que o traço e o determinante de uma matriz 


são invariantes sob uma transformação de similaridade. Assim, podemos falar em traço de 


um operador e determinante de um operador como quantidades independentes de qualquer 


escolha particular de base. 


C.3 Autovalores e Autovetores 


Definição C.4. Seja A um operador linear num espaço vetorial V sobre o corpo F. 


Um autovalor de A é um escalar c tal que existe um vetor não-nulo a em V que satisfaz 


Aa = ca. Dizemos que a é um autovetor de A associado ao autovalor c. O espectro de 


um operador linear A é o conjunto dos seus autovalores. 
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Teorema C.2. Todo operador linear sobre um espaço vetorial complexo de dimensão 


finita possui um autovetor. 


Demonstração. Um operador linear A num espaço vetorial complexo V de di- 
mensão n possui um autovetor se existe a # 0 tal que (A —cl)a = 0 para algum 
número complexo c. Logo, para que exista um autovetor é necessário e suficiente que o 
operador linear A — cl não seja inversível, isto é, numa base qualquer de V devemos ter 
det([4] — cI) = 0 para algum número complexo c. Mas det([A] — cl) é um polinômio de 
grau n em c, e o teorema fundamental da álgebra assegura que todo polinômio de grau 


positivo com coeficientes complexos possui uma raiz complexa. Logo, existe um número 


complexo c tal que det(|A] — cf) = 0 e a demonstração está completa. 
p q Ç p 


C.4 Produto Interno e Bases Ortonormais 


Definição C.5. Seja F o corpo dos números reais ou o corpo dos números complexos 
e seja V um espaço vetorial sobre F. Um produto interno ou produto escalar em V é 
uma regra que a cada par ordenado de vetores a, de V associa o escalar (œ, 8) de tal 


maneira que: 


(a) (@+ 8,9) = (a, 7) + (8,7); 
(b) (a,c8) = c(a, 8) para qualquer ce F; 
(c) (a, B) = (8,a)* , onde o asterisco indica conjugação complexa; 


(d) (a,a)>0 se a #0. 


As propriedades (a), (b) e (c) têm a seguinte implicação imediata: 


(e) (eB + 7,a) = (8,0) + (7,0). 


Quando F é o corpo dos números reais, os complexos conjugados em (c) e (e) são 
supérfluos. Outra conseqüência direta da definição de produto interno é (a,0) = 0. 
Combinado com (d), este último resultado estabelece que (a,a) = 0 se e somente se 


a = 0. Vale a pena mencionar que os matemáticos preferem substituir a propriedade (b) 


por (b” (ca, 8) = c(a, 8). 


Num espaço vetorial dotado de produto interno o número real não-negativo ||al|| 


definido por 


C.4. PRODUTO INTERNO E BASES ORTONORMAIS 425 


lla|] = y (a, a) (C.17) 

é chamado de norma ou módulo do vetor a. As seguintes propriedades da norma são de 
verificação imediata: (1) ||ca|| = |cl Ilall; (ii) |la|| > 0 e |la||= O see somente se a = 0. 
Sejam a = (£1,..., £n) € B = (y,...,;Yn) vetores de F”. O produto interno canônico 


em F” é definido por 


* 


CA a aa +2754 E (C.18) 


A norma canônica em F” é dada por 


llall = ylz? + foal? +- + [onl (C.19) 


Teorema C.3. Num espaço vetorial com produto interno valem a desigualdade de 


Schwarz 


(a, 8)| < Ilall [l6 (C.20) 


e a desigualdade triangular 
lla + Ell < lall + [IAI] - (C.21) 


Demonstração. Se a = 0 a desigualdade (C.20) é obviamente verdadeira. Se a #0, 


considere y = @ — ca. Usando as propriedades do produto interno podemos escrever 


0 < (7,7) = IIBIP — ~ (a, 8) — e(b, a) + Jellal? - (C.22) 


A escolha c = (a, 3)/|\a||? conduz a 


I(a, 8)? 


Ilall? 


Ipis 


ai (C.23) 


da qual decorre imediatamente a desigualdade de Schwarz. Usando agora (C.20), junta- 


mente com a desigualdade evidente Rez < |z|, temos 
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Ila + Bll? = |lall? + (a, 8) + (8,00) + |161? 


= |la||? + 2Re (a, 6) + |IGI|Ê < llall? + 2llall [181] + 116] ]É = (ell + 116|)° , (C-24) 


donde, por extração da raiz quadrada positiva, resulta a desigualdade triangular. 


Definição C.6. Num espaço vetorial V com produto interno dois vetores a e 5 são 
ditos ortogonais se (a, 3) = 0, e escrevemos a L 3. Dois subconjuntos R e S de V são 
ditos ortogonais, e escrevemos R L S, se cada vetor de R é ortogonal a cada vetor de S. 
Um conjunto de vetores tal que quaisquer dois vetores são ortogonais é dito um sistema 
ortogonal de vetores. Um vetor a é dito normalizado se ||a|| = 1. Um sistema ortogonal 


de vetores é dito um sistema ortonormal se cada vetor do sistema é normalizado. 


Um sistema ortonormal de vetores (£1,...,Eny satisfaz 


(64,6) =Ou , kl=1,...n. (6.25) 


Qualquer conjunto ortonormal de vetores é linearmente independente porque se 3), Ckék = 


0 então O = (6, ckék) = Du ce(€, ék) = Ve ceOn = CG. Assim, qualquer conjunto 
ortonormal de n vetores num espaço vetorial Y de dimensão n é base de V. Numa base 


ortonormal (&1,...,6n) um vetor a escreve-se a = 5,a;€;, donde 
(Ena) => (En aj) = Daj (Ex, E) =D any = ap. (C.26) 
j j J 
Portanto, 


k 


Um cálculo análogo mostra que, em termos das componentes relativas a uma base ortonor- 


mal, o produto interno assume uma forma particularmente simples: 


(a, b) =X (Er, a)" (Ek, b) (C.28) 


k 
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Se [A] = (a;;) é a matriz associada a um operador A numa base ortonormal {¢é1,..., €En}, 


a Eq.(C.27) combinada com a definição C.3 fornece imediatamente 


Teorema C.4. Todo espaço vetorial de dimensão finita com produto interno possui 


uma base ortonormal. 


Demonstração. Seja V um espaço vetorial com produto interno e seja {01,..., Qn} 
uma base de V. A partir desta base pode-se obter uma base ortogonal pelo processo de 
ortogonalização de Gram-Schmidt (Hoffmann & Kunze 1971). Dividindo cada um dos 


vetores da referida base ortogonal por sua respectiva norma, obtém-se a base ortonormal 


procurada. 


C.5 Complemento Ortogonal e Soma Direta 


Definição C.7. Seja V um espaço vetorial com produto interno e S um conjunto 
arbitrário de vetores de V. O complemento ortogonal de S consiste no conjunto S+ de 


todos os vetores de V que são ortogonais a todo vetor de S. 


Definição C.8. O espaço vetorial V é a soma direta dos espaços vetoriais U e W, 
e escrevemos V = U ® W , se cada elemento a de V pode ser expresso de maneira única 
como a = 8 +y, onde BEU e YEW. 


Teorema C.5. Se W é um subespaço de dimensão finita de um espaço vetorial V 


com produto interno, então V = We W+. 


Demonstração. Seja {&,...,& } uma base ortonormal de W , cuja existência é 


garantida pelo Teorema C.4. Qualquer vetor œ de V pode ser escrito como 


Q= 


(Era) & + 7 (C.30) 


1 


n 


k 
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onde 
n 


y=0u—53 (Ep, a) Ee - (C.31) 


k=1 


Com o uso de (C.25) verifica-se facilmente que (&;,7) = 0 para todo é;. Segue-se que 
y é ortogonal a qualquer combinação linear de (&1,...,€n), portanto é um elemento de 
WŁ. De acordo com (C.30), temos a= 8+7 com 3 em W e y em Wt. Resta provar 
que esta decomposição é única. Se a = 8’ +7 com 3’ em W ey em W+, temos 
B-B =7'-7. Como W+ também é um subespaço vetorial de V (verifique!), o vetor 
B" = 8-8 pertence ao mesmo tempo a W ea W+, isto é, (8", 8") = 0, o que implica 


B" =0. Logo 8'=8 ey =, o que estabelece a unicidade e completa a demonstração 


do teorema. o 


C.6 Adjunto de um Operador Linear 


Uma noção importantíssima é a de adjunto At de um operador linear A. A fim de 
definir o adjunto e estabelecer suas propriedades essenciais, é necessário primeiro introduzir 


o conceito de funcional linear. 


Definição C.9. Um funcional linear ® num espaço vetorial V é uma regra que 


associa um escalar ®(q@) a cada vetor a de V de tal modo que 
(caa + C22) = c(a) + CoP (a) (C.32) 
para todos os vetores @1,@ e escalares C1, C2. 


Por exemplo, se V é um espaço vetorial com produto interno e 5 é um vetor fixo, a 


função dg definida por 


ela) = (0,0) (C.33) 


é um funcional linear em virtude das propriedades do produto interno. Um resultado 


notável é que, se V tem dimensão finita, qualquer funcional linear é desta forma. 
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Teorema C.6. Seja V um espaço vetorial de dimensão finita com produto interno e 


® um funcional linear em V. Então existe um único vetor 8 de V tal que ®(a) = (8,4) 


para todo a de V. 


Demonstração. Seja {a1,...,@,} uma base ortonormal de V e defina 


D(a;)* a; . (C.34) 


Então 


j=1 j=1 j=1 


e, para um vetor genérico a com a = Yo, CkQk , 


n 


O(a) = 3 Ck lak) = 5 Gl Ook) = (8, = Crop) = (ya). . (C.36) 


k=1 


Para provar a unicidade, suponha que y seja outro vetor tal que ®(a) = (8,0) = (y,a) 


para todo a de V. Então o vetor p = y — 8 é ortogonal a todos os vetores de V, logo é 


ortogonal a si próprio. Assim, (p,p) =0 donde p=0 e y=. 


Teorema C.7. Se A é um operador linear num espaço vetorial Y de dimensão finita 


com produto interno, existe um único operador linear At tal que! 


(8,40) = (AtB, a) (C.37) 


para todos os a, em V. O operador At é chamado de adjunto de A. 


Demonstração. Como (a) = (3, Aa) é um funcional linear para 8 fixo, o Teorema 
C.6 nos diz que existe um único vetor $' em V tal que (3, Aa) = (8',a). O operador 


At é definido como a regra que associa 3’ a 8: 


'Os matemáticos preferem denotar o complexo conjugado de um número complexo z por Z e o adjunto 
de um operador linear A por A*. 
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AiB=B". (C.38) 


Resta verificar que At é um operador linear. Sejam (3, elementos de V e c1, c2 escalares. 
Para qualquer a, 


(A (ab T c27), a) = (c8 E C27; Aa) e (o, Aa) + cy, Aa) = ci(ATB, a) + c3(Aly, a) 


= (ca AtB, a) F (c2 A17, a) = (AtB T co Aly, a) , (C.39) 


de modo que At (cb + coy) = c1 AtB + Aly e Al é linear. 


As seguintes propriedades valem num espaço vetorial de dimensão finita e são de fácil 


comprovação: 
(1) (A+BJ = At + Bt; 
(2) (cA) = A! para ce F: 
(3) (AB)! = BIAl; 


(4) (AI =A. 


C.7 Operadores Unitários e Auto-Adjuntos 


Definição C.10. Um operador linear U num espaço vetorial V é dito unitário se o 


seu adjunto U' coincide com o seu inverso U~!, isto é, 


UU = UU =] . (C.40) 


Teorema C.8. Se U é um operador linear num espaço vetorial de dimensão finita, 
qualquer uma das condições a seguir é necessária e suficiente para que U seja unitário: 
(i) UUt=I ou UŻU = I; (ii) (UE, Un) = (£, n) para quaisquer vetores £n de V. 


Demonstração. No que concerne à parte (i), se U é unitário, tanto UU! = I 
quanto UU = I e nao há nada a demonstrar. Suponha, agora, que UU = I. Pelo 


Teorema C.1 o operador U é necessariamente inversível uma vez que Ua = 0 implica 
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a = Ia = U'Ua = U'O = 0. Multiplicando UU = I pela esquerda por U e pela 
direita por U~!, resulta UU! = I , e U é unitário. O mesmo argumento se aplica no caso 
UU! = I intercambiando-se os papéis de U e UT, e a demonstração de (i) está completa. 
Quanto à parte (ii), se U é unitário então (£, n) = (UUE, n) = (UE, Un) pela definição de 
adjunto. Inversamente, se (U£, Un) = (£,n) para quaiquer vetores £,7 de V , segue-se da 
definição de adjunto que (UUE, n) = (€,7) ou, equivalentemente, ((UIU — DE,m) = 0. 


Como é e 7 são vetores arbitrários, isto significa que U'U = I e, pela parte (i), U é 


unitário. 


Os operadores unitários podem ser caracterizados pela propriedade de mapear bases 


ortonormais em bases ortonormais. 


Teorema C.9. Se U é um operador unitário num espaço vetorial de dimensão finita 


Ve {a1,..., Qn} é base ortonormal de V, então {Ua,,...,Ua,} também é base ortonor- 
mal de V. Reciprocamente, se {a1,...,Qn} e {(1,...,8,} são bases ortonormais de V, 
existe um operador unitário U tal que 6, =Ua, , k=1,...,n 


Demonstração. Se U é unitário, (Uap, Ua) = (U'Uax, ai) = (az, a1) = On € 
{Uay,...,Ua,} é base ortonormal de V. Se {a1,...,a@n} e {G1,...,8n} são bases 
ortonormais de VY, defina o operador linear U por Va, = Bk, k = 1,...,n. Para 


quaisquer vetores € = >, XY: Qn € N= Xp Y, Qk pertencentes a V temos 


n 


(UE, Un) = (Stew, Yu Uai) = ot yt (Be, B) = >, xe Yi Sut 


I=1 kl=1 


= o Ly, Yt (Ok, 04) = ak, Y UN ar) = (8,1) (C.41) 
kl=1 k=1 l=1 


e U é unitário pelo Teorema C.8. 


Definição C.11. Um operador linear A num espaço vetorial V é dito auto-adjunto 


ou hermitiano se At = A. 


Os operadores unitários e auto-adjuntos são de importância fundamental para a Física, 


e seus autovalores e autovetores gozam de propriedades simples. 
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Teorema C.10. Se c é um autovalor de um operador unitário então |c| = 1. Os 
autovalores de um operador auto-adjunto são reais e os autovetores de um operador auto- 


adjunto associados a autovalores distintos são mutuamente ortogonais. 


Demonstração. Se U é unitário e Ua = ca então (a,a) = (Ua, Ua) = (ca,ca) = 
\c|?(a, a) . Logo, |c|? = 1 e, consequentemente, |c| = 1. Se A é auto-adjuntoe Aa = ca 


então 


c(a,a) = (a,ca) = (a, Aa) = (Ala, a) = (Aa, a) = (ca,a) = e (a,0) . (C.42) 


Como (a,a) # 0, segue-se que c = c e c é real. Finalmente, sejam a ;,a2 vetores 


nao-nulos tais que Aa, = cya; e Áa = co09. Então 


co(a1, Q2) = (01, C202) = (01, Aa2) = (Atay, a2) = (Aaj, a2) = (c1Q1, Q2) = €1(Q4, 2) ; 
(C.43) 


onde usamos o fato de cı ser real. Da Eq.(C.43) deduz-se (c2 — c1)(a1, 2) = 0, de modo 


que (01,05) =0 se cy Æ c2. E 


Teorema C.11. Todo operador auto-adjunto sobre um espaço vetorial de dimensão 


finita possui um autovetor. 


Demonstração. Se o espaço vetorial é complexo, o resultado está contido no Teorema 
C.2. Se o espaço vetorial é real, o teorema fundamental da álgebra estabelece que existe 
um número complexo c tal que det([A] — cI) = 0 onde [A] é a matriz do operador A 
em alguma base. Logo, existe uma matriz-coluna não-nula [a] tal que [Al[a| = cla]. Mas 


como A é auto-adjunto, c é real e podemos tomar [a] com elementos reais. Portanto, 


existe um vetor não-nulo a tal que Aa =ca. 


Um resultado crucial para aplicações à Física assegura que, dado um operador auto- 
adjunto A num espaço vetorial de dimensão finita V, existe uma base de V constituída 
por autovetores de 4. Como veremos, isto equivale a dizer que qualquer matriz hermitiana 
pode ser diagonalizada por uma transformação de similaridade efetuada por uma matriz 
unitária. Para provar este resultado em sua completa generalidade, precisamos de uma 


definição e de um teorema preliminar. 


Definição C.12. Seja V um espaço vetorial e A um operador linear em V. Se W 
é um subespaço vetorial de V, dizemos que W é invariante sob A se para cada vetor a 


de W o vetor Aa pertence a W. 
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Teorema C.12. Seja V um espaço vetorial de dimensão finita com produto interno e 
seja A um operador linear em V. Se W é um subespaço vetorial de V que é invariante 


sob A, então o complemento ortogonal de W é invariante sob At. 


Demonstração. Tomemos 8 pertencente a W+. Precisamos provar que A!f está 
em W+, ou seja, que (a, A!8) = 0 para todo a em W. Mas se a está em W então 
Aa também está em W e, portanto, (Aa, 8) = 0, donde, pela definição de adjunto, 
(a, AtB) = (Aa, 6) =0. 


Agora estamos prontos para enunciar e provar o resultado que constitui o ponto cul- 


minante deste apêndice: o teorema espectral para operadores auto-adjuntos. 


Teorema C.13. Seja V um espaço vetorial de dimensão finita munido de produto in- 
terno e seja 4 um operador linear auto-adjunto em V. Então existe uma base ortonormal 


de V constituída por autovetores de 4. 


Demonstração. Seja N > 0 a dimensão de V. Pelo Teorema C.11, A possui um 
autovetor a, de modo que a; = a/ || a || é um autovetor normalizado de A. Se N=1 
já terminamos. Procedemos, agora, por indução sobre N. Se N > 1, suponhamos que 
o teorema seja válido para espaços de dimensão menor que N. Se W é o subespaço 
unidimensional gerado por ay, dizer que a, é autovetor de A significa simplesmente que 
W é invariante sob A. Pelo Teorema C.12, o complemento ortogonal W+ é invariante 
sob A! = A. Mas W+, com o produto interno de V , é um espaço vetorial com produto 
interno de dimensão N—1. Seja T o operador linear induzido sobre W+ por A, isto é, a 
restrição de A a W+. O operador T é bem definido sobre W+ porque W+ é invariante 
sob a ação de A. Claramente, T é auto-adjunto e, pela hipótese de indução, W possui 


uma base ortonormal {a2,...,a@,} composta por autovetores de T , logo, de A. Como 


V = W p WŁ, concluímos que {a1,...,@,} é a base procurada. 


Se A é um operador auto-adjunto, de (C.29) deduz-se que sua matriz [A] numa base 


ortonormal {a1,..., Qn} tem elementos 


Qij = (ai, Aa;) = (Atai, a;) = (Aai, az) = (aj, Aa;)* = as ; (C44) 


ju 


de modo que 
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[Alt = [Al (C.45) 


e [4] é uma matriz hermitiana. Deste resultado inferimos que um operador linear é auto- 
adjunto se e somente se sua matriz em alguma (logo, toda) base ortonormal é hermitiana. 


Por outro lado, se U é um operador unitário, 


big = (04, aj) = (Vas, Vay) = X ugua, an) = > uganda = D Uta; o» (C46) 
k 


k,l k,l 


donde 


[U] [U] =T . (C.47) 


Assim, det [U] #0 e [U] é matriz inversivel, de modo que 


(Uy! = [u> (C.48) 


e [U] é uma matriz unitária. Segue-se que um operador linear é unitário se e somente se 
sua matriz em alguma (logo, toda) base ortonormal é unitária. É importante notar que 
num espaço vetorial sobre o corpo dos números reais uma matriz hermitiana é o mesmo 
que uma matriz real simétrica, ou seja, uma matriz que coincide com sua transposta. Da 
mesma forma, num espaço vetorial real uma matriz unitária reduz-se a uma matriz real 


ortogonal, isto é, uma matriz cuja transposta é igual à sua inversa. 


De acordo com as observações acima, uma mudança de base ortonormal corresponde, 
por (C.16), a uma transformação de similaridade das matrizes associadas aos operadores 


realizada por uma matriz unitária, isto é, 


[Aly = [S]4 [Ala [S]e - (C.49) 


Se [A] é matriz hermitiana na base X, 
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de modo que [A] também é hermitiana na base Y. Analogamente, se a matriz [U] é 


unitária na base XY, 


e [U] também é matriz unitária na base V. Portanto, uma mudança de base ortonor- 
mal mapeia matrizes auto-adjuntas em matrizes auto-adjuntas e matrizes unitárias em 
matrizes unitárias. Notando que numa base ortonormal composta por autovetores de um 
operador linear A sua matriz associada [A| é diagonal, as observações acima permitem 


uma tradução do Teorema (C.13) em termos de matrizes. 


Teorema C.14. Qualquer matriz hermitiana pode ser diagonalizada por uma trans- 
formação de similaridade executada por uma matriz unitária. Em particular, uma matriz 
real simétrica pode ser diagonalizada por uma transformação de similaridade executada 


por uma matriz real ortogonal. 


Apêndice D 


Diferenciais Exatas 


Neste apêndice definimos diferenciais exatas e estabelecemos as condições necessárias 


e suficientes para que uma dada forma diferencial seja exata. 


Sejam fi, fo,...,fn funções reais de n variáveis reais x1,%9,...,%, € suponhamos 
que cada uma das funções f; bem como cada uma das suas derivadas parciais Of;/0x; 
sejam contínuas numa região aberta O C R”. Restrições adicionais sobre a região O 
aparecerão de forma natural na discussão a ser desenvolvida abaixo. Sempre que revelar-se 


conveniente, utilizaremos a notação abreviada x = (114,...,%n). 


Definição D.1. A quantidade 


Q = > fidzi (D.1) 
i=1 
é dita uma diferencial exata em O se existe uma função F(z1,..., £n) tal que 
N 
dF => fidz; (D2) 
i=1 
em O ou, equivalentemente, se existe uma função F(qz1,..., £n) tal que 
f= £ (D.3) 


em cada ponto da região O. 
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Teorema D.1. A quantidade Q = 5, fidx; é uma diferencial exata em O se e 


somente se 


Of O 


= eo beer DA 
Ox; Ox; b) 1,9 2 yn ( ) 


em todos os pontos de O. 


Demonstraçãa Provemos a necessidade de (D.4). Se Q = X; f; dx; é uma diferencial 
exata em O existe uma função F tal que f; = OF /0x;. Da continuidade das derivadas 


parciais das funções f; segue-se que 


Of, ËF OF af 
Ox; E Ox 0X; z Oxð Tj = Ox; ? 


i,j=1,...,n (D.5) 


em cada ponto de O. Para demonstrar a suficiência, suponhamos a validade de (D.4) e 
consideremos a função F(x1,...,1,n) definida como a integral de linha de >; fidx; ao longo 
de um segmento de reta unindo um ponto fixo P ao ponto genérico P = (x1,...,%n) de 
O. Escolhendo a origem do sistema de coordenadas no ponto Pg, as equações da linha 


reta em questão podem ser postas na forma paramétrica 


ElA)= Az; , Ac [0,1], (D.6) 


de modo que 


=f 5 fu(6) dék = = fed) xpd . (D.7) 


Po k=1 


Conseguentemente, 


ft ade 
=> Sin f(A) D+ fas NG (At) sp dA 


oh = (Xt) dd , (D.8) 


=f fix) 
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onde usamos (D.4). Notando que, para x fixo, 


nF dba) Tk , (D.9) 


podemos escrever 


z = EA | fi(da) + Gs) | a= 4 (xf) dd = df,(Az) 


= fla) , (D10) 


A=0 


completando a demonstracao do teorema. 


Note que o teorema se aplica a qualquer região aberta © dotada da seguinte pro- 
priedade: existe um ponto Pp € O tal que para qualquer ponto P € O o segmento de 
reta de Py até P está inteiramente contido em O. Um subconjunto aberto de R” deste 


tipo é dito estrelado (“star-shaped”) no ponto P) (Spivak 1965). 
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